ガイド

Schema 設計

AI が確実に抽出できる JSON Schema の設計

/extract に渡す Schema は プロンプトでもあります。すべてのフィールド名、description、型ヒントをモデルが読みます。よく整形された Schema は精度を劇的に向上させます。

フィールド命名

英語として自然に読める名前を使ってください。モデルは pnname1 よりも productName のほうがはるかに得意です。

{ "type": "object", "properties": {
  "productName": { "type": "string" },
  "currentPrice": { "type": "number" }
} }

フィールドの description

曖昧なものには必ず description を追加してください。"price" は希望小売価格、現在価格、単価のいずれにもなり得ます —— 明示的に書いてください:

{ "currentPrice": {
  "type": "number",
  "description": "Final price after discount, in USD"
} }

必須 vs 任意

本当に必要なフィールドだけを必須にしてください。必須フィールドはモデルが見つけられなければ抽出全体を失敗させます —— 控えめに使用してください。

ネスト

役立つ場合は 1 階層のネスト(address.city)を推奨します。深いネスト(3 階層以上)は抽出品質を下げる傾向があります。

よくある落とし穴

  • 曖昧な型を使う("$19.99" のような数値に string を使う)—— number を選び、モデルにパースさせるほうがよい
  • description のない曖昧な enum
  • すべてのページに実際には存在しない必須フィールド

このページは Schema クックブックを追加して拡張中です —— 近日中に再確認してください。