Distill vs Extract

Thunderbit는 서로 다른 문제를 해결하는 두 개의 AI 엔드포인트 —— /distill과 /extract —— 를 제공합니다. 올바른 선택이 비용, 지연 시간, 출력 품질을 좌우하는 가장 큰 요인입니다.

Distill을 사용해야 할 때

페이지 전체의 깔끔한 LLM-ready Markdown이 필요할 때
다운스트림 소비자가 vector store, RAG 파이프라인, 또는 LLM 컨텍스트일 때
어떤 필드가 필요할지 사전에 모를 때

Extract를 사용해야 할 때

구조화 데이터(JSON)로 원하는 정확한 필드를 알고 있을 때
다운스트림 소비자가 데이터베이스, 대시보드, 또는 타입 있는 코드일 때
모델이 필드 단위 추론을 하길 원할 때(예: "할인율은 얼마인가?")

비용 & 지연 시간 트레이드오프

	Distill	Extract
크레딧	페이지당 1	페이지당 20
지연 시간	더 낮음(AI 추출 단계 없음)	더 높음(AI 단계 + Schema 검증)
출력	Markdown	Schema에 부합하는 JSON

결정 매트릭스

출력이 콘텐츠(텍스트, 기사, 지식 베이스 항목)라면 → Distill. 출력이 레코드(행, 필드, 타입화된 값)라면 → Extract. 확실하지 않다면 Distill로 시작하세요 —— 나중에 Markdown 위에서 Extract를 돌릴 수 있습니다.

이 페이지는 구체적인 예제로 확장 중입니다 —— 곧 다시 확인하세요.

Distill을 사용해야 할 때

Extract를 사용해야 할 때

비용 & 지연 시간 트레이드오프

결정 매트릭스

On this page