指南

Distill vs Extract

兩個端點分別何時用、為何用

Thunderbit 提供兩個 AI 端點 —— /distill 與 /extract —— 解決的是不同問題。選對端點是決定成本、延遲與輸出品質的最大單一因素。

何時用 Distill

你想要整頁的乾淨、LLM 就緒 Markdown
下游消費者是向量庫、RAG 流水線或 LLM 上下文
你還不確定最終會用到哪些欄位

何時用 Extract

你已經明確知道想要哪些欄位作為結構化資料（JSON）
下游消費者是資料庫、儀表板或型別化程式碼
你想讓模型做欄位級推理（例如「折扣是多少？」）

成本與延遲取捨

	Distill	Extract
點數	1 / 頁	20 / 頁
延遲	較低（無 AI 擷取步驟）	較高（AI 步驟 + Schema 驗證）
輸出	Markdown	符合你 Schema 的 JSON

決策矩陣

如果你的輸出是內容（文字、文章、知識庫條目）→ Distill。如果你的輸出是記錄（列、欄位、型別化值）→ Extract。如果不確定，先從 Distill 開始 —— 之後永遠可以再對 Markdown 跑 Extract。

本頁正在補充具體範例 —— 敬請回訪。

目錄

何時用 Distill 何時用 Extract 成本與延遲取捨決策矩陣