RAG LabPhase 5청킹

Document Parser & Chunker

문서를 파싱하고 다양한 전략으로 청크를 분할해보세요. PDF, TXT, MD, DOCX를 지원합니다.

RAG Lab 시리즈
1 / 4
📄

문서 파싱

PDF, TXT, MD, DOCX 파일을 텍스트로 변환하는 과정을 체험합니다

✂️

청킹 전략

5가지 분할 방법(고정크기, 문장, 재귀, 단락, 의미)을 비교합니다

🔗

오버랩 이해

청크 간 중복 영역이 문맥 보존에 어떤 역할을 하는지 시각적으로 확인합니다

📊

통계 분석

청크 수, 평균 크기, 토큰 수 등 다양한 통계를 실시간으로 분석합니다

Document Chunker 로딩 중...

청킹이란?

청킹(Chunking)은 긴 문서를 작은 조각으로 나누는 과정입니다. RAG 시스템에서 검색 품질을 결정하는 핵심 단계입니다.

  • • 너무 큰 청크: 관련 없는 정보 포함, 검색 정확도 저하
  • • 너무 작은 청크: 문맥 손실, 의미 불완전
  • • 최적 청크: 하나의 주제/개념을 완결적으로 포함

FDE 커리큘럼 연계

이 시뮬레이터는 RAG Lab 시리즈의 첫 번째 도구입니다. 다음 단계로 진행하세요:

  1. 1. Document Parser & Chunker (현재)
  2. 2. Embedding Explorer - 청크를 벡터로 변환
  3. 3. Vector Store Simulator - 벡터 저장소 탐색
  4. 4. Retrieval & Generation - 검색 및 답변 생성

다음 학습