OpenAICloudflare Developer PlatformApr 20, 2026, 12:00 AM

Workers AI - Moonshot AI Kimi K2.6 now available on Workers AI

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Workers AI - Moonshot AI Kimi K2.6 now available on Workers AI

Key Points

  • 1T MoE model with 32B active per token
  • 262.1k token context window
  • Swarm orchestration up to 300 sub-agents

Summary

Moonshot AI Kimi K2.6 is now available on Workers AI (Day 0 support from Moonshot AI). Kimi K2.6 is a native multimodal, agentic model built on a Mixture-of-Experts (MoE) architecture (1T total parameters, 32B active per token) designed for long-horizon coding, coding-driven design, proactive autonomous execution, swarm-based task orchestration, and multimodal (vision + text) workflows. It delivers efficient inference and competitive benchmark performance (e.g., BrowseComp 83.2, SWE-Bench Verified 80.2, Terminal-Bench 2.0 66.7).

Key Points

  • Architecture: MoE with 1T total parameters and ~32B active parameters per token for efficient, frontier-scale inference.
  • Massive context: 262.1k token context window for full conversation history, tool definitions, and codebases in long-running agent sessions.
  • Long-horizon coding: Improved end-to-end coding across Rust, Go, Python and other languages.
  • Coding-driven design: Converts prompts and visual inputs into production-ready interfaces and full-stack workflows.
  • Agent orchestration: Swarm orchestration up to 300 sub-agents executing ~4,000 coordinated steps for complex autonomous tasks.
  • Multimodal: Vision inputs supported alongside text; multi-turn tool calling and configurable "thinking" reasoning depth.

Migration notes

  • API change: use chat_template_kwargs.thinking (replaces chat_template_kwargs.enable_thinking).
  • Reasoning output: reasoning field replaces reasoning_content.

Getting started

  • Workers AI binding: env.AI.run()
  • REST API: POST /ai/run
  • OpenAI-compatible: POST /v1/chat/completions
  • AI Gateway can proxy any of the above endpoints. See the Kimi K2.6 model page and pricing for details.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Workers AI - Moonshot AI の Kimi K2.6 が Workers AI で利用可能に

Moonshot AI Kimi K2.6 が Workers AI に登場

公開日: 2026-04-20

Workers AI 上で @cf/moonshotai/kimi-k2.6 が利用可能になりました。Moonshot AI と提携し、Day 0 サポートを提供します。

Kimi K2.6 は Moonshot AI によるネイティブなマルチモーダル・エージェントモデルで、長期にまたがるコーディング、コーディング駆動のデザイン、プロアクティブな自律実行、およびスウォームベースのタスクオーケストレーションにおける実用的能力を進化させています。Mixture-of-Experts アーキテクチャ(合計 1T parameters、トークンあたり 32B active)を採用し、効率的な推論でフロンティア級の知能を提供します。

ベンチマーク実績(抜粋):

  • BrowseComp: 83.2
  • SWE-Bench Verified: 80.2
  • Terminal-Bench 2.0: 66.7

GPT-5.4 や Claude Opus 4.6 と競合するスコアを示し、特にエージェント的タスクやコーディングベンチマークで高い性能を発揮します。

主な機能

  • 262.1k トークンのコンテキストウィンドウ:長時間にわたるエージェントセッションで会話履歴、ツール定義、コードベースを完全保持
  • 長期コーディング:Rust、Go、Python を含む複数言語での複雑なエンドツーエンドコーディングタスクに対する大幅な改善
  • コーディング駆動デザイン:シンプルなプロンプトや視覚入力からプロダクション対応のインターフェースやフルスタックワークフローを生成
  • エージェントスウォームオーケストレーション:水平スケールで最大 300 サブエージェント、4,000 ステップの協調実行による複雑な自律タスクの遂行
  • ビジョン入力:テキストと並行して画像を処理
  • Thinking モード:推論の深さを設定可能
  • マルチターンツールコーリング:複数ターンにわたってツールを呼び出すエージェントの構築をサポート

Kimi K2.5 からの差分(API 変更点)

  • chat_template_kwargs.thinking が推論制御に使用されます(旧: chat_template_kwargs.enable_thinking を置換)
  • 推論コンテンツは reasoning フィールドで返されます(旧: reasoning_content を置換)

K2.5 から移行する場合は上記のフィールド名変更に注意してください。

利用開始

Kimi K2.6 は以下の方法で利用できます:

  • Workers AI バインディング(env.AI.run()
  • REST API: /ai/run
  • OpenAI 互換エンドポイント: /v1/chat/completions

これらのいずれのエンドポイントでも AI Gateway を使用できます。詳しくは Kimi K2.6 のモデルページおよび pricing を参照してください。

参考・リソース

  • Kimi K2.6 モデルページおよび pricing(詳細は該当ページを参照)
  • API ドキュメント(Workers AI / REST / OpenAI 互換エンドポイント)

ご不明点があれば、Workers AI のドキュメントや Moonshot AI のサポートをご確認ください。