指南
Distill vs Extract
什么时候用哪个端点,为什么
Thunderbit 提供两个 AI 端点 —— /distill 和 /extract —— 用来解决不同的问题。选对端点是决定成本、延迟和输出质量的最大单一因素。
什么时候用 Distill
- 你想要整页干净的、LLM 就绪的 Markdown
- 下游消费者是向量库、RAG 流水线或 LLM 上下文
- 你事先不知道自己需要哪些字段
什么时候用 Extract
- 你明确知道想要的字段,输出为结构化数据(JSON)
- 下游消费者是数据库、仪表盘或带类型的代码
- 你希望模型做字段级推理(比如"折扣是多少?")
成本与延迟权衡
| Distill | Extract | |
|---|---|---|
| 点数 | 每页 1 点 | 每页 20 点 |
| 延迟 | 较低(不走 AI 提取步骤) | 较高(AI 步骤 + Schema 校验) |
| 输出 | Markdown | 符合你 Schema 的 JSON |
决策矩阵
如果输出是内容(文本、文章、知识库条目)→ Distill。 如果输出是记录(行、字段、带类型的值)→ Extract。 如果不确定,先用 Distill —— 你随时可以再对 Markdown 跑一次 Extract。
本页正在补充更多具体示例 —— 敬请期待。