ガイド
Distill と Extract の使い分け
どのエンドポイントを、いつ、なぜ使うか
Thunderbit には 2 つの AI エンドポイント —— /distill と /extract —— があり、それぞれ異なる課題を解決します。正しいものを選ぶことが、コスト・レイテンシ・出力品質に最も大きく影響します。
Distill を使うとき
- ページ全体を LLM 即対応のクリーンな Markdown で得たい
- 下流の利用先がベクトルストア、RAG パイプライン、または LLM コンテキスト
- どのフィールドが必要か事前にわからない
Extract を使うとき
- 構造化データ(JSON)として欲しいフィールドが明確に決まっている
- 下流の利用先がデータベース、ダッシュボード、または型付きコード
- モデルにフィールドレベルの推論をさせたい(例:「割引率はいくら?」)
コストとレイテンシのトレードオフ
| Distill | Extract | |
|---|---|---|
| クレジット | 1 / ページ | 20 / ページ |
| レイテンシ | より低い(AI 抽出ステップなし) | より高い(AI ステップ + Schema 検証) |
| 出力 | Markdown | あなたの Schema に準拠した JSON |
判断マトリクス
出力が コンテンツ(テキスト、記事、ナレッジベースのエントリ)の場合 → Distill。 出力が レコード(行、フィールド、型付きの値)の場合 → Extract。 迷ったときは Distill から始めてください —— 後から Markdown に対して Extract を実行することはいつでも可能です。
このページは具体例を追加して拡張中です —— 近日中に再確認してください。