Gidsen

Distill vs Extract

Welk endpoint je wanneer en waarom gebruikt

Thunderbit biedt twee AI-endpoints — /distill en /extract — die verschillende problemen oplossen. De juiste kiezen is de allerbelangrijkste factor voor kosten, latency en outputkwaliteit.

Wanneer Distill gebruiken

  • Je wilt schone, LLM-klare Markdown van een hele pagina
  • De downstream-consument is een vector store, RAG-pipeline of LLM-context
  • Je weet vooraf niet welke velden je nodig hebt

Wanneer Extract gebruiken

  • Je weet de exacte velden die je als gestructureerde data (JSON) wilt
  • De downstream-consument is een database, dashboard of getypeerde code
  • Je wilt dat het model redenering op veldniveau doet (bijv. "wat is de korting?")

Kosten- en latency-afwegingen

DistillExtract
Credits1 / pagina20 / pagina
LatencyLager (geen AI-extractiestap)Hoger (AI-stap + schema-validatie)
OutputMarkdownJSON conform je schema

Beslissingsmatrix

Als je output content is (tekst, artikelen, kennisbank-items) → Distill. Als je output records zijn (rijen, velden, getypeerde waarden) → Extract. Weet je het niet zeker, begin dan met Distill — je kunt later altijd Extract op de markdown draaien.

Deze pagina wordt uitgebreid met concrete voorbeelden — kom snel terug.