指南

Distill vs Extract

兩個端點分別何時用、為何用

Thunderbit 提供兩個 AI 端點 —— /distill/extract —— 解決的是不同問題。選對端點是決定成本、延遲與輸出品質的最大單一因素。

何時用 Distill

  • 你想要整頁的乾淨、LLM 就緒 Markdown
  • 下游消費者是向量庫、RAG 流水線或 LLM 上下文
  • 你還不確定最終會用到哪些欄位

何時用 Extract

  • 你已經明確知道想要哪些欄位作為結構化資料(JSON)
  • 下游消費者是資料庫、儀表板或型別化程式碼
  • 你想讓模型做欄位級推理(例如「折扣是多少?」)

成本與延遲取捨

DistillExtract
點數1 / 頁20 / 頁
延遲較低(無 AI 擷取步驟)較高(AI 步驟 + Schema 驗證)
輸出Markdown符合你 Schema 的 JSON

決策矩陣

如果你的輸出是 內容(文字、文章、知識庫條目)→ Distill。 如果你的輸出是 記錄(列、欄位、型別化值)→ Extract。 如果不確定,先從 Distill 開始 —— 之後永遠可以再對 Markdown 跑 Extract。

本頁正在補充具體範例 —— 敬請回訪。