指南
Distill vs Extract
兩個端點分別何時用、為何用
Thunderbit 提供兩個 AI 端點 —— /distill 與 /extract —— 解決的是不同問題。選對端點是決定成本、延遲與輸出品質的最大單一因素。
何時用 Distill
- 你想要整頁的乾淨、LLM 就緒 Markdown
- 下游消費者是向量庫、RAG 流水線或 LLM 上下文
- 你還不確定最終會用到哪些欄位
何時用 Extract
- 你已經明確知道想要哪些欄位作為結構化資料(JSON)
- 下游消費者是資料庫、儀表板或型別化程式碼
- 你想讓模型做欄位級推理(例如「折扣是多少?」)
成本與延遲取捨
| Distill | Extract | |
|---|---|---|
| 點數 | 1 / 頁 | 20 / 頁 |
| 延遲 | 較低(無 AI 擷取步驟) | 較高(AI 步驟 + Schema 驗證) |
| 輸出 | Markdown | 符合你 Schema 的 JSON |
決策矩陣
如果你的輸出是 內容(文字、文章、知識庫條目)→ Distill。 如果你的輸出是 記錄(列、欄位、型別化值)→ Extract。 如果不確定,先從 Distill 開始 —— 之後永遠可以再對 Markdown 跑 Extract。
本頁正在補充具體範例 —— 敬請回訪。