Google Gemma 4 26B A4B が Workers AI で利用可能に

公開日: 2026-04-04

私たちは Google と提携し、@cf/google/gemma-4-26b-a4b-it を Workers AI に導入しました。Gemma 4 26B A4B は Gemini 3 の研究に基づく Mixture-of-Experts (MoE) モデルで、総パラメータ数は 26B、1 回のフォワードパスあたりアクティブになるのはわずか 4B です。推論時にパラメータの小さなサブセットを活性化することで、ほぼ 4B パラメータモデルと同等の速度で動作しつつ、はるかに大きなモデルに匹敵する品質を提供します。

主な機能

Mixture-of-Experts (MoE) アーキテクチャ
- 128 個のエキスパートのうち 8 個がアクティブ（+1 共有エキスパート）
- 密な（dense）モデルと比べて計算コストを大幅に削減しつつフロンティアレベルの性能を発揮
長大コンテキスト対応
- 256,000 トークンのコンテキストウィンドウで会話履歴、ツール定義、長文ドキュメントを保持可能
組み込みの思考モード（built-in thinking mode）
- 回答前にステップバイステップで推論し、複雑なタスクの精度を向上
ビジョン理解
- 物体検出、ドキュメント/PDF パース、画面・UI 理解、チャート理解、OCR（多言語対応）、手書き認識
- 可変アスペクト比および解像度をサポート
Function calling
- 構造化ツール利用をネイティブにサポートし、エージェント的ワークフローやマルチステップ計画を実現
多言語対応
- 35+ 言語をそのままサポート、140+ 言語で事前学習済み
コーディング支援
- コード生成、補完、修正に対応

利用方法

以下のいずれかの方法で Gemma 4 26B A4B を利用できます:

Workers AI バインディング: env.AI.run() を使用
REST API: POST /run または POST /v1/chat/completions
OpenAI 互換エンドポイント

詳細な使用例やパラメータ、レート制限などは Gemma 4 26B A4B のモデルページを参照してください。

リソース

モデル: Gemma 4 26B A4B model page
API ドキュメント: Workers AI バインディングおよび REST API のドキュメントを参照

このリリースにより、低い推論コストで高性能な大規模モデルをエッジ上で活用できるようになります。フィードバックや問題報告は Cloudflare のサポートチャネルをご利用ください。

Workers AI - Google Gemma 4 26B A4B now available on Workers AI

Summary

Summary

Key Points

Usage

Practical Notes

Translations

Google Gemma 4 26B A4B が Workers AI で利用可能に

主な機能

利用方法

リソース