가이드
Distill vs Extract
어떤 엔드포인트를 언제, 왜 사용해야 하는가
Thunderbit는 서로 다른 문제를 해결하는 두 개의 AI 엔드포인트 —— /distill과 /extract —— 를 제공합니다. 올바른 선택이 비용, 지연 시간, 출력 품질을 좌우하는 가장 큰 요인입니다.
Distill을 사용해야 할 때
- 페이지 전체의 깔끔한 LLM-ready Markdown이 필요할 때
- 다운스트림 소비자가 vector store, RAG 파이프라인, 또는 LLM 컨텍스트일 때
- 어떤 필드가 필요할지 사전에 모를 때
Extract를 사용해야 할 때
- 구조화 데이터(JSON)로 원하는 정확한 필드를 알고 있을 때
- 다운스트림 소비자가 데이터베이스, 대시보드, 또는 타입 있는 코드일 때
- 모델이 필드 단위 추론을 하길 원할 때(예: "할인율은 얼마인가?")
비용 & 지연 시간 트레이드오프
| Distill | Extract | |
|---|---|---|
| 크레딧 | 페이지당 1 | 페이지당 20 |
| 지연 시간 | 더 낮음(AI 추출 단계 없음) | 더 높음(AI 단계 + Schema 검증) |
| 출력 | Markdown | Schema에 부합하는 JSON |
결정 매트릭스
출력이 콘텐츠(텍스트, 기사, 지식 베이스 항목)라면 → Distill. 출력이 레코드(행, 필드, 타입화된 값)라면 → Extract. 확실하지 않다면 Distill로 시작하세요 —— 나중에 Markdown 위에서 Extract를 돌릴 수 있습니다.
이 페이지는 구체적인 예제로 확장 중입니다 —— 곧 다시 확인하세요.