openaijamodel: gpt-5-mini-2025-08-07
AI Search:Workers AIでテキスト生成と埋め込みの新モデルを追加
Key Points
- 131,072トークン対応モデル追加
- 4,096トークン対応埋め込み
- Workers AIで追加キー不要
Summary
AI SearchにWorkers AI上で動作する4つの新モデルが追加されました。テキスト生成向けに長文処理可能なGLM-4.7-Flash(131,072トークン)と、Mixture-of-Experts設計で高速なQwen3-30B-A3B(32,000トークン)。埋め込み向けに長い入力を扱えるqwen3-embedding-0.6b(1,024次元、最大4,096トークン)と低レイテンシ向けのembeddinggemma-300m(768次元)を提供します。これらは追加の提供元キー不要で、ダッシュボードまたはAPIからAI Searchインスタンス作成・更新時に選択可能です。
Key Points
- 新規テキスト生成モデル
- @cf/zai-org/glm-4.7-flash:131,072トークンの超長文コンテキスト、長文要約・リトリーバルに最適。
- @cf/qwen/qwen3-30b-a3b-fp8:32,000トークン、MoEで実行時に3Bパラメータのみ活性化し高速かつ高品質な応答。
- 新規埋め込みモデル
- @cf/qwen/qwen3-embedding-0.6b:1,024次元、最大4,096トークンの入力対応で長いテキストチャンクのインデックス向け。
- @cf/google/embeddinggemma-300m:768次元、低レイテンシ埋め込み用途に最適。
- 運用面のポイント
- いずれのモデルもWorkers AI上で動作し、追加のプロバイダキーは不要。
- ダッシュボードまたはAPIでAI Searchインスタンス作成/更新時に選択可能。
- 推奨選択例:長文要約や長いコンテキストの検索はGLM-4.7-Flash、低レイテンシなベクトル化が必要ならembeddinggemma-300m、長いチャンクをそのままインデックスするならqwen3-embeddingを使用。
参照:Supported models(ダッシュボード/APIでのモデル一覧を確認してください)