Workers AI に Google Gemma 4 26B A4B モデルが追加
Key Points
- MoEアーキテクチャで高性能と高速処理を両立
- 256,000トークンの大容量コンテキストウィンドウ
- 画像理解とOCRを含むマルチモーダル機能
Summary
CloudflareがGoogleと提携し、Workers AIプラットフォームに新しいAIモデル「Gemma 4 26B A4B」を追加しました。このモデルはMixture-of-Experts(MoE)アーキテクチャを採用し、26Bパラメータを持ちながら推論時には4Bパラメータのみを使用することで、高性能と高速処理を両立しています。
Key Points
- MoEアーキテクチャ: 128個の専門家のうち8個のみをアクティブ化し、密なモデルの一部のコンピュート コストでフロンティアレベルの性能を実現
- 大容量コンテキスト: 256,000トークンのコンテキストウィンドウで長い会話履歴や文書を保持
- マルチモーダル機能: 画像理解、文書解析、OCR、手書き認識などの視覚的理解をサポート
- 多言語対応: 35以上の言語をサポート、140以上の言語で事前学習済み
- 関数呼び出し: 構造化されたツール使用とエージェント的ワークフローをネイティブサポート
- アクセス方法: Workers AIバインディング、REST API、OpenAI互換エンドポイントで利用可能