指南

Distill vs Extract

什么时候用哪个端点，为什么

Thunderbit 提供两个 AI 端点 —— /distill 和 /extract —— 用来解决不同的问题。选对端点是决定成本、延迟和输出质量的最大单一因素。

什么时候用 Distill

你想要整页干净的、LLM 就绪的 Markdown
下游消费者是向量库、RAG 流水线或 LLM 上下文
你事先不知道自己需要哪些字段

什么时候用 Extract

你明确知道想要的字段，输出为结构化数据（JSON）
下游消费者是数据库、仪表盘或带类型的代码
你希望模型做字段级推理（比如"折扣是多少？"）

成本与延迟权衡

	Distill	Extract
点数	每页 1 点	每页 20 点
延迟	较低（不走 AI 提取步骤）	较高（AI 步骤 + Schema 校验）
输出	Markdown	符合你 Schema 的 JSON

决策矩阵

如果输出是内容（文本、文章、知识库条目）→ Distill。如果输出是记录（行、字段、带类型的值）→ Extract。如果不确定，先用 Distill —— 你随时可以再对 Markdown 跑一次 Extract。

本页正在补充更多具体示例 —— 敬请期待。

目录

什么时候用 Distill 什么时候用 Extract 成本与延迟权衡决策矩阵