Distill vs Extract

Thunderbit biedt twee AI-endpoints — /distill en /extract — die verschillende problemen oplossen. De juiste kiezen is de allerbelangrijkste factor voor kosten, latency en outputkwaliteit.

Wanneer Distill gebruiken

Je wilt schone, LLM-klare Markdown van een hele pagina
De downstream-consument is een vector store, RAG-pipeline of LLM-context
Je weet vooraf niet welke velden je nodig hebt

Wanneer Extract gebruiken

Je weet de exacte velden die je als gestructureerde data (JSON) wilt
De downstream-consument is een database, dashboard of getypeerde code
Je wilt dat het model redenering op veldniveau doet (bijv. "wat is de korting?")

Kosten- en latency-afwegingen

	Distill	Extract
Credits	1 / pagina	20 / pagina
Latency	Lager (geen AI-extractiestap)	Hoger (AI-stap + schema-validatie)
Output	Markdown	JSON conform je schema

Als je output content is (tekst, artikelen, kennisbank-items) → Distill. Als je output records zijn (rijen, velden, getypeerde waarden) → Extract. Weet je het niet zeker, begin dan met Distill — je kunt later altijd Extract op de markdown draaien.

Deze pagina wordt uitgebreid met concrete voorbeelden — kom snel terug.

Wanneer Distill gebruiken

Wanneer Extract gebruiken

Kosten- en latency-afwegingen

Beslissingsmatrix

On this page