Deep Dive: Text2Cypher가 실패하는 7가지 패턴 | Text2Cypher & NL2Query | FDE Academy

LLM이 만든 Cypher, 왜 틀릴까?

Text2Cypher의 정확도는 보통 60~85% 수준이다. 나머지 15~40%는 왜 실패하는지 알아야 개선할 수 있다.

에디터 로딩 중...

LLM이 생성할 수 있는 Cypher들:

에디터 로딩 중...

대응 방안:

에디터 로딩 중...

결과: 에러는 나지 않지만, 빈 결과가 반환된다 (Neo4j는 없는 속성을 null로 처리).

대응 방안:

에디터 로딩 중...

에디터 로딩 중...

핵심: "인수한"과 "인수된"의 구분은 한국어 문맥에서 특히 어렵다.

대응 방안:

에디터 로딩 중...

이 질문을 LLM이 한 번에 올바른 Cypher로 변환하기 매우 어렵다:

에디터 로딩 중...

대응 방안:

에디터 로딩 중...

대응 방안:

에디터 로딩 중...

대응 방안:

에디터 로딩 중...

에디터 로딩 중...

실제 DB에 어떤 값이 저장되어 있는지 LLM은 모른다!

대응 방안:

에디터 로딩 중...

패턴	빈도	심각도	주요 대응
모호한 질문	높음	중간	프롬프트 규칙, clarification
없는 속성	중간	높음	스키마 검증, 속성 체크
잘못된 방향	중간	높음	Few-shot 예시
복합 질문	중간	높음	질문 분해, CoT
타입 불일치	낮음	중간	타입 정보 명시
LIMIT 누락	높음	높음	후처리 강제
언어 혼동	중간	중간	샘플 데이터 제공