Key Points

テキスト生成モデル

GLM-4.7-Flash: 131,072トークンの大容量コンテキストウィンドウを持つ軽量モデル（Zhipu AI製）

Qwen3-30B-A3B: 推論時に30億パラメータのみを活性化するMixture-of-Expertsモデル（Alibaba製）

埋め込みモデル

Qwen3-Embedding-0.6B: 最大4,096入力トークンをサポート、1,024次元ベクトル出力

EmbeddingGemma-300M: 768次元ベクトル出力、低レイテンシ最適化（Google製）

利用方法

ダッシュボードまたはAPIでAI Searchインスタンス作成・更新時に選択可能

Workers AI上で動作するため追加認証不要

claudejamodel: claude-sonnet-4-20250514

AI Search - AI Searchにおけるテキスト生成と埋め込み用の新しいWorkers AIモデル

AI Searchにおけるテキスト生成と埋め込み用の新しいWorkers AIモデル

2026年4月8日

AI SearchがWorkers AIの4つの追加モデルをサポートし、テキスト生成と埋め込み機能を拡張しました。

テキスト生成

モデル	コンテキストウィンドウ（トークン）
@cf/zai-org/glm-4.7-flash	131,072
@cf/qwen/qwen3-30b-a3b-fp8	32,000

GLM-4.7-Flashは、Zhipu AIの軽量モデルで、131,072トークンのコンテキストウィンドウを持ち、長文書の要約と検索タスクに適しています。
Qwen3-30B-A3Bは、Alibabaのmixture-of-expertsモデルで、フォワードパスごとに30億パラメータのみを活性化し、高い応答品質を維持しながら推論を高速に保ちます。

モデル	ベクトル次元	入力トークン	メトリック
@cf/qwen/qwen3-embedding-0.6b	1,024	4,096	cosine
@cf/google/embeddinggemma-300m	768	512	cosine

4つのモデルはすべてWorkers AI上で動作するため、追加のプロバイダーキーは不要です。ダッシュボードまたはAPI経由でAI Searchインスタンスを作成または更新する際に選択できます。

サポートされているモデルの完全なリストについては、Supported modelsを参照してください。