Diseño de Schema
Diseñar JSON Schemas que la IA pueda extraer de forma fiable
El Schema que pasas a /extract es también un prompt. Cada nombre de campo, descripción y pista de tipo es leída por el modelo. Un Schema bien diseñado mejora la precisión drásticamente.
Nombres de campo
Usa nombres que se lean como inglés. El modelo es mucho mejor con productName que con pn o name1.
{ "type": "object", "properties": {
"productName": { "type": "string" },
"currentPrice": { "type": "number" }
} }Descripciones de campo
Añade description a cualquier cosa ambigua. "price" podría ser MSRP, actual o por unidad — sé explícito:
{ "currentPrice": {
"type": "number",
"description": "Final price after discount, in USD"
} }Required vs opcional
Marca solo los campos que realmente necesitas. Los campos required hacen que toda la extracción falle si el modelo no los encuentra — úsalos con moderación.
Anidamiento
Prefiere un nivel de anidamiento donde sea útil (address.city). Anidamientos más profundos (3+ niveles) tienden a degradar la calidad de la extracción.
Errores comunes
- Usar tipos ambiguos (
stringpara números como"$19.99") — prefierenumbery deja que el modelo lo parsee - Enums vagos sin descripciones
- Campos required que no están realmente presentes en cada página
Esta página se está ampliando con un recetario de Schemas — vuelve pronto.