OpenAICloudflare Developer Platform2026/04/16 12:00

AI Search - AI Search now has hybrid search and relevance boosting

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

AI Searchがハイブリッド検索と関連度ブーストをサポート

Key Points

  • ハイブリッド検索を追加
  • 関連度ブースト対応
  • トークナイザーと融合方法を設定可能

Summary

AI Searchはハイブリッド検索(ベクトル検索 + BM25キーワード検索)と関連度ブースト機能を追加しました。これにより意味検索とキーワード一致を単一クエリで並列実行して融合し、ドキュメントメタデータに基づく順位調整(最大3フィールド)を行えます。

Key Points

  • ハイブリッド検索: ベクトル(意味)検索とBM25キーワード検索を同時に実行して結果を融合し単一のランキングで返す。例: index_method: { vector: true, keyword: true }
  • 設定項目: トークナイザー(porter:自然文、trigram:コード)、keyword_match_modeand/or)、融合方法(rrf or max)をインスタンス単位で指定可能。
  • 関連度ブースト: boost_byで最大3フィールドを指定して順位を調整(例: timestampやカスタムpriority)。リクエスト単位で上書き可能。例: boost_by: [{ field: "timestamp", direction: "desc" }]
  • 運用ヒント: 精度重視ならkeyword_match_mode: "and"や融合をrrfに、再現率重視ならormaxを検討。ブーストは古い/新しい順や優先度フィールドでの過学習に注意して少数フィールドに絞る。

参考: 管理画面/APIドキュメントの「Search modes」「Hybrid search」「Relevance boosting」を参照してください。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

AI Search — ハイブリッド検索と関連性ブースティングが利用可能に

AI Search にハイブリッド検索と関連性ブースティングが追加されました

AI Search はハイブリッド検索と関連性ブースティングをサポートし、検索結果の検出とランキングをより細かく制御できるようになりました。

ハイブリッド検索

ハイブリッド検索は、ベクトル(セマンティック)検索と BM25 キーワード検索を 1 回のクエリで組み合わせます。ベクトル検索は語彙が異なっていても意味的に類似したチャンクを見つけ、キーワード検索はクエリ語を正確に含むチャンクと一致します。ハイブリッド検索を有効にすると、両方が並列で実行され、結果が融合されて単一のランク付きリストになります。

設定可能な項目:

  • トークナイザー(自然言語向けは "porter"、コード向けは "trigram")
  • キーワード一致モード(精度を優先する場合は "and"、網羅性を優先する場合は "or")
  • 融合方法("rrf" または "max")

これらはインスタンスごとに設定できます。例(TypeScript):

const instance = await env . AI_SEARCH . create ( { id : "my-instance" , index_method : { vector : true , keyword : true }, fusion_method : "rrf" , indexing_options : { keyword_tokenizer : "porter" }, retrieval_options : { keyword_match_mode : "and" }, } ) ;

参照: Search modes(概要)および Hybrid search(構成の詳細)。

関連性ブースティング

関連性ブースティングでは、ドキュメントのメタデータに基づいて検索ランキングを調整できます。たとえば、"timestamp" で最近のドキュメントを優先したり、"priority" のようなカスタムメタデータで重要なコンテンツを上位に表示できます。インスタンスごとに最大 3 つのブーストフィールドを設定するか、リクエスト単位で上書きできます。

例(TypeScript):

const results = await env . AI_SEARCH . get ( "my-instance" ) . search ( { messages : [ { role : "user" , content : "deployment guide" } ] , ai_search_options : { retrieval : { boost_by : [ { field : "timestamp" , direction : "desc" }, { field : "priority" , direction : "desc" }, ] , }, }, } ) ;

参照: Relevance boosting(構成の詳細)。