Gidsen
Distill vs Extract
Welk endpoint je wanneer en waarom gebruikt
Thunderbit biedt twee AI-endpoints — /distill en /extract — die verschillende problemen oplossen. De juiste kiezen is de allerbelangrijkste factor voor kosten, latency en outputkwaliteit.
Wanneer Distill gebruiken
- Je wilt schone, LLM-klare Markdown van een hele pagina
- De downstream-consument is een vector store, RAG-pipeline of LLM-context
- Je weet vooraf niet welke velden je nodig hebt
Wanneer Extract gebruiken
- Je weet de exacte velden die je als gestructureerde data (JSON) wilt
- De downstream-consument is een database, dashboard of getypeerde code
- Je wilt dat het model redenering op veldniveau doet (bijv. "wat is de korting?")
Kosten- en latency-afwegingen
| Distill | Extract | |
|---|---|---|
| Credits | 1 / pagina | 20 / pagina |
| Latency | Lager (geen AI-extractiestap) | Hoger (AI-stap + schema-validatie) |
| Output | Markdown | JSON conform je schema |
Beslissingsmatrix
Als je output content is (tekst, artikelen, kennisbank-items) → Distill. Als je output records zijn (rijen, velden, getypeerde waarden) → Extract. Weet je het niet zeker, begin dan met Distill — je kunt later altijd Extract op de markdown draaien.
Deze pagina wordt uitgebreid met concrete voorbeelden — kom snel terug.