指南

Distill vs Extract

什么时候用哪个端点,为什么

Thunderbit 提供两个 AI 端点 —— /distill/extract —— 用来解决不同的问题。选对端点是决定成本、延迟和输出质量的最大单一因素。

什么时候用 Distill

  • 你想要整页干净的、LLM 就绪的 Markdown
  • 下游消费者是向量库、RAG 流水线或 LLM 上下文
  • 你事先不知道自己需要哪些字段

什么时候用 Extract

  • 你明确知道想要的字段,输出为结构化数据(JSON)
  • 下游消费者是数据库、仪表盘或带类型的代码
  • 你希望模型做字段级推理(比如"折扣是多少?")

成本与延迟权衡

DistillExtract
点数每页 1 点每页 20 点
延迟较低(不走 AI 提取步骤)较高(AI 步骤 + Schema 校验)
输出Markdown符合你 Schema 的 JSON

决策矩阵

如果输出是内容(文本、文章、知识库条目)→ Distill。 如果输出是记录(行、字段、带类型的值)→ Extract。 如果不确定,先用 Distill —— 你随时可以再对 Markdown 跑一次 Extract。

本页正在补充更多具体示例 —— 敬请期待。