OpenAICloudflare Developer Platform2026/04/04 0:00

Workers AI - Google Gemma 4 26B A4B now available on Workers AI

要点だけを先に読めるように短く再構成したセクションです。

元記事

OpenAI Claude

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Workers AIでGoogle Gemma 4 26B A4Bが利用可能に

moe gemma4 workers-ai multimodal long-context function-calling vision

Key Points

MoEで4B相当の高速推論
最大256kトークンの長期コンテキスト
Workers AIでenv.AI.run()から利用可

Summary

GoogleのGemma 4 26B A4B（Mixture-of-Experts, MoE）がWorkers AIで利用可能になりました。総パラメータは26Bながら、推論時には約4B相当のアクティブパラメータで動作するため、低コストかつ高性能な推論が可能です。エンジニア向けには長文コンテキスト、マルチモーダル解析、ツール呼び出しベースのワークフローに最適です。

Key Points

アーキテクチャ: MoE（128エキスパート＋共有1、推論時に8エキスパートがアクティブ）、26B総パラメータ／4Bアクティブ相当の高速化
長期コンテキスト: 最大256,000トークンのコンテキストウィンドウで会話履歴や長文を保持
推論機能: "thinking mode"（ステップ思考）で複雑タスクの精度向上
マルチモーダル: 物体検出、PDF/ドキュメント解析、画面/UI理解、チャート解析、OCR（多言語）や手書き認識をサポート
ツール連携: ネイティブな関数呼び出し（function calling）でエージェント的ワークフローやマルチステップ計画に対応
言語・コーディング: 35以上の言語を標準サポート、コード生成・補完・修正にも利用可能
利用方法: Workers AIバインディング（env.AI.run()）、RESTエンドポイント（/run または /v1/chat/completions）、OpenAI互換エンドポイントで利用可能

Practical notes

長い会話履歴や大規模ドキュメント処理、マルチモーダル解析、ツール駆動の自動化エージェントで効果を発揮します。
運用上はレイテンシとコストを密に計測し、4B相当の応答速度と大型モデルの品質のトレードオフを評価してください。
詳細や制限はGemma 4 26B A4BのモデルページとCloudflareドキュメントを参照してください。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

Workers AI - Google Gemma 4 26B A4B が Workers AI で利用可能に

Google Gemma 4 26B A4B が Workers AI で利用可能に

公開日: 2026-04-04

私たちは Google と提携し、@cf/google/gemma-4-26b-a4b-it を Workers AI に導入しました。Gemma 4 26B A4B は Gemini 3 の研究に基づく Mixture-of-Experts (MoE) モデルで、総パラメータ数は 26B、1 回のフォワードパスあたりアクティブになるのはわずか 4B です。推論時にパラメータの小さなサブセットを活性化することで、ほぼ 4B パラメータモデルと同等の速度で動作しつつ、はるかに大きなモデルに匹敵する品質を提供します。

主な機能

Mixture-of-Experts (MoE) アーキテクチャ
- 128 個のエキスパートのうち 8 個がアクティブ（+1 共有エキスパート）
- 密な（dense）モデルと比べて計算コストを大幅に削減しつつフロンティアレベルの性能を発揮
長大コンテキスト対応
- 256,000 トークンのコンテキストウィンドウで会話履歴、ツール定義、長文ドキュメントを保持可能
組み込みの思考モード（built-in thinking mode）
- 回答前にステップバイステップで推論し、複雑なタスクの精度を向上
ビジョン理解
- 物体検出、ドキュメント/PDF パース、画面・UI 理解、チャート理解、OCR（多言語対応）、手書き認識
- 可変アスペクト比および解像度をサポート
Function calling
- 構造化ツール利用をネイティブにサポートし、エージェント的ワークフローやマルチステップ計画を実現
多言語対応
- 35+ 言語をそのままサポート、140+ 言語で事前学習済み
コーディング支援
- コード生成、補完、修正に対応

利用方法

以下のいずれかの方法で Gemma 4 26B A4B を利用できます:

Workers AI バインディング: env.AI.run() を使用
REST API: POST /run または POST /v1/chat/completions
OpenAI 互換エンドポイント

詳細な使用例やパラメータ、レート制限などは Gemma 4 26B A4B のモデルページを参照してください。

リソース

モデル: Gemma 4 26B A4B model page
API ドキュメント: Workers AI バインディングおよび REST API のドキュメントを参照

このリリースにより、低い推論コストで高性能な大規模モデルをエッジ上で活用できるようになります。フィードバックや問題報告は Cloudflare のサポートチャネルをご利用ください。