25분
Text2Cypher 접근 방식: Rule vs Template vs LLM
Day 1: Text2Cypher 개론
Text2Cypher 접근 방식: Rule vs Template vs LLM
Text2Cypher & NL2Query > Day 1: Text2Cypher 개론
학습 목표
Text2Cypher의 3가지 접근 방식을 비교할 수 있다 각 방식의 장단점과 적용 시나리오를 안다 LLM 기반 접근의 동작 원리를 상세히 설명할 수 있다
Text2Cypher를 구현하는 3가지 방식
자연어를 Cypher로 변환하는 방법은 크게 3가지가 있다. 각각 장단점이 뚜렷하다.
에디터 로딩 중...
1. Rule-based (규칙 기반)
키워드와 정규식을 사용해 Cypher를 조립하는 방식.
에디터 로딩 중...
| 장점 | 단점 |
|---|---|
| API 비용 없음 | 미리 정의한 패턴만 지원 |
| 매우 빠름 (ms 단위) | 새로운 질문 유형마다 규칙 추가 필요 |
| 예측 가능한 결과 | 자연어 변형에 취약 ("경쟁사", "경쟁 업체", "라이벌" 다 다름) |
| 보안 위험 낮음 | 복잡한 질문 처리 불가 |
적합한 상황: 질문 유형이 10개 이하로 명확할 때, 내부 도구의 빠른 프로토타입
2. Template-based (템플릿 기반)
미리 만든 Cypher 템플릿에 파라미터를 바인딩하는 방식.
에디터 로딩 중...
| 장점 | 단점 |
|---|---|
| 정확하고 안전한 Cypher | 템플릿 수 = 지원 질문 수 |
| 파라미터 바인딩으로 SQL Injection 방지 | 복합 질문 처리 어려움 |
| 성능 우수 | 유지보수 비용 증가 |
| 결과 예측 가능 | 새 스키마에 대응하려면 수정 필요 |
적합한 상황: FAQ 형태의 반복적 질문, 보안이 최우선인 환경
3. LLM-based (LLM 기반) -- 이번 주의 핵심
LLM이 스키마를 이해하고 자유롭게 Cypher를 생성하는 방식.
에디터 로딩 중...
| 장점 | 단점 |
|---|---|
| 사전에 못 본 질문도 처리 | API 비용 발생 |
| 자연어 변형 자동 대응 | 잘못된 Cypher 생성 가능 |
| 복합 질문 처리 가능 | 응답 시간 1-3초 |
| 스키마 변경에 자동 적응 | 보안 검증 필수 |
적합한 상황: 질문이 다양하고 예측 불가능할 때, 빠른 프로토타이핑
어떤 방식을 선택할까?
| 기준 | Rule-based | Template | LLM |
|---|---|---|---|
| 질문 다양성 낮음 | Best | Good | Overkill |
| 질문 다양성 높음 | Bad | Limited | Best |
| 보안 최우선 | Best | Best | 검증 필요 |
| 프로토타입 | Good | Good | Best |
| 비용 민감 | Best | Best | 비쌈 |
| 정확도 | 높음 (범위 내) | 높음 | 중~높 |
실무 추천: LLM 기반 + Template fallback의 하이브리드 방식
에디터 로딩 중...
이번 주에는 LLM 기반을 중심으로 배우되, 프로덕션에서는 하이브리드 방식을 권장한다.