Distill と Extract の使い分け

Thunderbit には 2 つの AI エンドポイント —— /distill と /extract —— があり、それぞれ異なる課題を解決します。正しいものを選ぶことが、コスト・レイテンシ・出力品質に最も大きく影響します。

Distill を使うとき

ページ全体を LLM 即対応のクリーンな Markdown で得たい
下流の利用先がベクトルストア、RAG パイプライン、または LLM コンテキスト
どのフィールドが必要か事前にわからない

Extract を使うとき

構造化データ（JSON）として欲しいフィールドが明確に決まっている
下流の利用先がデータベース、ダッシュボード、または型付きコード
モデルにフィールドレベルの推論をさせたい（例：「割引率はいくら？」）

コストとレイテンシのトレードオフ

	Distill	Extract
クレジット	1 / ページ	20 / ページ
レイテンシ	より低い（AI 抽出ステップなし）	より高い（AI ステップ + Schema 検証）
出力	Markdown	あなたの Schema に準拠した JSON

判断マトリクス

出力が コンテンツ（テキスト、記事、ナレッジベースのエントリ）の場合 → Distill。出力が レコード（行、フィールド、型付きの値）の場合 → Extract。迷ったときは Distill から始めてください —— 後から Markdown に対して Extract を実行することはいつでも可能です。

このページは具体例を追加して拡張中です —— 近日中に再確認してください。

Distill と Extract の使い分け

Distill を使うとき

Extract を使うとき

コストとレイテンシのトレードオフ

判断マトリクス

目次