RAG LabPhase 5청킹
Document Parser & Chunker
문서를 파싱하고 다양한 전략으로 청크를 분할해보세요. PDF, TXT, MD, DOCX를 지원합니다.
RAG Lab 시리즈
1 / 4
📄
문서 파싱
PDF, TXT, MD, DOCX 파일을 텍스트로 변환하는 과정을 체험합니다
✂️
청킹 전략
5가지 분할 방법(고정크기, 문장, 재귀, 단락, 의미)을 비교합니다
🔗
오버랩 이해
청크 간 중복 영역이 문맥 보존에 어떤 역할을 하는지 시각적으로 확인합니다
📊
통계 분석
청크 수, 평균 크기, 토큰 수 등 다양한 통계를 실시간으로 분석합니다
Document Chunker 로딩 중...
청킹이란?
청킹(Chunking)은 긴 문서를 작은 조각으로 나누는 과정입니다. RAG 시스템에서 검색 품질을 결정하는 핵심 단계입니다.
- • 너무 큰 청크: 관련 없는 정보 포함, 검색 정확도 저하
- • 너무 작은 청크: 문맥 손실, 의미 불완전
- • 최적 청크: 하나의 주제/개념을 완결적으로 포함
FDE 커리큘럼 연계
이 시뮬레이터는 RAG Lab 시리즈의 첫 번째 도구입니다. 다음 단계로 진행하세요:
- 1. Document Parser & Chunker (현재)
- 2. Embedding Explorer - 청크를 벡터로 변환
- 3. Vector Store Simulator - 벡터 저장소 탐색
- 4. Retrieval & Generation - 검색 및 답변 생성