ClaudeCloudflare Developer Platform2026/04/08 0:00

AI Search - New Workers AI models for text generation and embedding in AI Search

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

claudejamodel: claude-sonnet-4-20250514

AI Search に新しい Workers AI モデルが追加 - テキスト生成と埋め込み機能を強化

Key Points

  • 4つの新しいWorkers AIモデルがAI Searchに追加
  • 最大131,072トークンのコンテキストウィンドウをサポート
  • 追加のプロバイダーキー不要で即座に利用可能

Summary

Cloudflare AI Search に4つの新しい Workers AI モデルが追加されました。テキスト生成用に2つ、埋め込み用に2つのモデルが利用可能になり、追加のプロバイダーキーなしで使用できます。

Key Points

テキスト生成モデル

  • GLM-4.7-Flash: 131,072トークンの大容量コンテキストウィンドウを持つ軽量モデル(Zhipu AI製)
  • Qwen3-30B-A3B: 推論時に30億パラメータのみを活性化するMixture-of-Expertsモデル(Alibaba製)

埋め込みモデル

  • Qwen3-Embedding-0.6B: 最大4,096入力トークンをサポート、1,024次元ベクトル出力
  • EmbeddingGemma-300M: 768次元ベクトル出力、低レイテンシ最適化(Google製)

利用方法

  • ダッシュボードまたはAPIでAI Searchインスタンス作成・更新時に選択可能
  • Workers AI上で動作するため追加認証不要

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

claudejamodel: claude-sonnet-4-20250514

AI Search - AI Searchにおけるテキスト生成と埋め込み用の新しいWorkers AIモデル

AI Searchにおけるテキスト生成と埋め込み用の新しいWorkers AIモデル

2026年4月8日

AI SearchがWorkers AIの4つの追加モデルをサポートし、テキスト生成と埋め込み機能を拡張しました。

テキスト生成

モデルコンテキストウィンドウ(トークン)
@cf/zai-org/glm-4.7-flash131,072
@cf/qwen/qwen3-30b-a3b-fp832,000
  • GLM-4.7-Flashは、Zhipu AIの軽量モデルで、131,072トークンのコンテキストウィンドウを持ち、長文書の要約と検索タスクに適しています。
  • Qwen3-30B-A3Bは、Alibabaのmixture-of-expertsモデルで、フォワードパスごとに30億パラメータのみを活性化し、高い応答品質を維持しながら推論を高速に保ちます。

埋め込み

モデルベクトル次元入力トークンメトリック
@cf/qwen/qwen3-embedding-0.6b1,0244,096cosine
@cf/google/embeddinggemma-300m768512cosine
  • Qwen3-Embedding-0.6Bは最大4,096入力トークンをサポートし、より長いテキストチャンクのインデックス化に適しています。
  • EmbeddingGemma-300MはGoogleのモデルで、768次元ベクトルを生成し、低レイテンシの埋め込みワークロードに最適化されています。

利用方法

4つのモデルはすべてWorkers AI上で動作するため、追加のプロバイダーキーは不要です。ダッシュボードまたはAPI経由でAI Searchインスタンスを作成または更新する際に選択できます。

サポートされているモデルの完全なリストについては、Supported modelsを参照してください。

リソース