OpenAICloudflare Developer Platform2026/04/04 0:00

Workers AI - Google Gemma 4 26B A4B now available on Workers AI

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

Workers AIでGoogle Gemma 4 26B A4Bが利用可能に

Key Points

  • MoEで4B相当の高速推論
  • 最大256kトークンの長期コンテキスト
  • Workers AIでenv.AI.run()から利用可

Summary

GoogleのGemma 4 26B A4B(Mixture-of-Experts, MoE)がWorkers AIで利用可能になりました。総パラメータは26Bながら、推論時には約4B相当のアクティブパラメータで動作するため、低コストかつ高性能な推論が可能です。エンジニア向けには長文コンテキスト、マルチモーダル解析、ツール呼び出しベースのワークフローに最適です。

Key Points

  • アーキテクチャ: MoE(128エキスパート+共有1、推論時に8エキスパートがアクティブ)、26B総パラメータ/4Bアクティブ相当の高速化
  • 長期コンテキスト: 最大256,000トークンのコンテキストウィンドウで会話履歴や長文を保持
  • 推論機能: "thinking mode"(ステップ思考)で複雑タスクの精度向上
  • マルチモーダル: 物体検出、PDF/ドキュメント解析、画面/UI理解、チャート解析、OCR(多言語)や手書き認識をサポート
  • ツール連携: ネイティブな関数呼び出し(function calling)でエージェント的ワークフローやマルチステップ計画に対応
  • 言語・コーディング: 35以上の言語を標準サポート、コード生成・補完・修正にも利用可能
  • 利用方法: Workers AIバインディング(env.AI.run())、RESTエンドポイント(/run または /v1/chat/completions)、OpenAI互換エンドポイントで利用可能

Practical notes

  • 長い会話履歴や大規模ドキュメント処理、マルチモーダル解析、ツール駆動の自動化エージェントで効果を発揮します。
  • 運用上はレイテンシとコストを密に計測し、4B相当の応答速度と大型モデルの品質のトレードオフを評価してください。
  • 詳細や制限はGemma 4 26B A4BのモデルページとCloudflareドキュメントを参照してください。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

Workers AI - Google Gemma 4 26B A4B が Workers AI で利用可能に

Google Gemma 4 26B A4B が Workers AI で利用可能に

公開日: 2026-04-04

私たちは Google と提携し、@cf/google/gemma-4-26b-a4b-it を Workers AI に導入しました。Gemma 4 26B A4B は Gemini 3 の研究に基づく Mixture-of-Experts (MoE) モデルで、総パラメータ数は 26B、1 回のフォワードパスあたりアクティブになるのはわずか 4B です。推論時にパラメータの小さなサブセットを活性化することで、ほぼ 4B パラメータモデルと同等の速度で動作しつつ、はるかに大きなモデルに匹敵する品質を提供します。

主な機能

  • Mixture-of-Experts (MoE) アーキテクチャ
    • 128 個のエキスパートのうち 8 個がアクティブ(+1 共有エキスパート)
    • 密な(dense)モデルと比べて計算コストを大幅に削減しつつフロンティアレベルの性能を発揮
  • 長大コンテキスト対応
    • 256,000 トークンのコンテキストウィンドウで会話履歴、ツール定義、長文ドキュメントを保持可能
  • 組み込みの思考モード(built-in thinking mode)
    • 回答前にステップバイステップで推論し、複雑なタスクの精度を向上
  • ビジョン理解
    • 物体検出、ドキュメント/PDF パース、画面・UI 理解、チャート理解、OCR(多言語対応)、手書き認識
    • 可変アスペクト比および解像度をサポート
  • Function calling
    • 構造化ツール利用をネイティブにサポートし、エージェント的ワークフローやマルチステップ計画を実現
  • 多言語対応
    • 35+ 言語をそのままサポート、140+ 言語で事前学習済み
  • コーディング支援
    • コード生成、補完、修正に対応

利用方法

以下のいずれかの方法で Gemma 4 26B A4B を利用できます:

  • Workers AI バインディング: env.AI.run() を使用
  • REST API: POST /run または POST /v1/chat/completions
  • OpenAI 互換エンドポイント

詳細な使用例やパラメータ、レート制限などは Gemma 4 26B A4B のモデルページを参照してください。

リソース

  • モデル: Gemma 4 26B A4B model page
  • API ドキュメント: Workers AI バインディングおよび REST API のドキュメントを参照

このリリースにより、低い推論コストで高性能な大規模モデルをエッジ上で活用できるようになります。フィードバックや問題報告は Cloudflare のサポートチャネルをご利用ください。