ガイド

Distill と Extract の使い分け

どのエンドポイントを、いつ、なぜ使うか

Thunderbit には 2 つの AI エンドポイント —— /distill/extract —— があり、それぞれ異なる課題を解決します。正しいものを選ぶことが、コスト・レイテンシ・出力品質に最も大きく影響します。

Distill を使うとき

  • ページ全体を LLM 即対応のクリーンな Markdown で得たい
  • 下流の利用先がベクトルストア、RAG パイプライン、または LLM コンテキスト
  • どのフィールドが必要か事前にわからない

Extract を使うとき

  • 構造化データ(JSON)として欲しいフィールドが明確に決まっている
  • 下流の利用先がデータベース、ダッシュボード、または型付きコード
  • モデルにフィールドレベルの推論をさせたい(例:「割引率はいくら?」)

コストとレイテンシのトレードオフ

DistillExtract
クレジット1 / ページ20 / ページ
レイテンシより低い(AI 抽出ステップなし)より高い(AI ステップ + Schema 検証)
出力Markdownあなたの Schema に準拠した JSON

判断マトリクス

出力が コンテンツ(テキスト、記事、ナレッジベースのエントリ)の場合 → Distill。 出力が レコード(行、フィールド、型付きの値)の場合 → Extract。 迷ったときは Distill から始めてください —— 後から Markdown に対して Extract を実行することはいつでも可能です。

このページは具体例を追加して拡張中です —— 近日中に再確認してください。