ClaudeCloudflare Developer PlatformApr 20, 2026, 12:00 AM

Workers AI - Moonshot AI Kimi K2.6 now available on Workers AI

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

claudeenmodel: claude-haiku-4-5

Moonshot AI Kimi K2.6 Now Available on Workers AI

Key Points

  • Kimi K2.6 multimodal agentic model now available on Workers AI
  • 262.1k token context window with competitive benchmark performance
  • Agent swarm orchestration supporting 300 sub-agents and 4,000 coordinated steps

Summary

@cf/moonshotai/kimi-k2.6 is now available on Workers AI in partnership with Moonshot AI. Kimi K2.6 is a native multimodal agentic model built on a Mixture-of-Experts architecture with 1T total parameters and 32B active per token, delivering frontier-scale intelligence with efficient inference.

Key Points

  • Context & Performance: 262.1k token context window; scores competitively against GPT-5.4 and Claude Opus 4.6 on agentic and coding benchmarks (BrowseComp: 83.2, SWE-Bench Verified: 80.2, Terminal-Bench 2.0: 66.7)
  • Core Capabilities: Long-horizon coding across Rust, Go, and Python; coding-driven design for production-ready interfaces; agent swarm orchestration supporting 300 sub-agents with 4,000 coordinated steps; vision inputs and multi-turn tool calling
  • API Changes from K2.5: Reasoning controlled via chat_template_kwargs.thinking (replaces enable_thinking); reasoning content returned in reasoning field (replaces reasoning_content)
  • Access Methods: Available through Workers AI binding (env.AI.run()), REST API (/ai/run), OpenAI-compatible endpoint (/v1/chat/completions), and AI Gateway

Full Translation

Translations

A translation section that keeps the flow of the original article.

claudejamodel: claude-haiku-4-5

Workers AI - Moonshot AI Kimi K2.6 が利用可能に

Moonshot AI Kimi K2.6 が Workers AI で利用可能になりました

2026年4月20日

@cf/moonshotai/kimi-k2.6 が Workers AI で利用可能になりました。Moonshot AI とのパートナーシップにより Day 0 サポートを提供しています。

Kimi K2.6 は Moonshot AI による ネイティブマルチモーダルエージェントモデルで、長期的なコーディング、コーディング駆動設計、プロアクティブな自律実行、およびスウォームベースのタスク オーケストレーションにおける実用的な機能を向上させます。

1T の総パラメータと 1 トークンあたり 32B のアクティブパラメータを備えた Mixture-of-Experts アーキテクチャ上に構築されており、Kimi K2.6 は効率的な推論により最先端規模のインテリジェンスを提供します。BrowseComp (83.2)、SWE-Bench Verified (80.2)、Terminal-Bench 2.0 (66.7) を含むエージェントおよびコーディングベンチマークで、GPT-5.4 および Claude Opus 4.6 と競争力のあるスコアを達成しています。

主な機能

  • 262.1k トークンコンテキストウィンドウ - 長時間実行されるエージェントセッション全体で、完全な会話履歴、ツール定義、およびコードベースを保持
  • 長期的なコーディング - Rust、Go、Python を含む複数の言語にわたる複雑なエンドツーエンドのコーディングタスクで大幅な改善
  • コーディング駆動設計 - シンプルなプロンプトとビジュアル入力を本番環境対応のインターフェースとフルスタックワークフローに変換
  • エージェントスウォームオーケストレーション - 複雑な自律タスク用に 300 個のサブエージェントが 4,000 の調整されたステップを実行するように水平スケーリング
  • ビジョン入力 - テキストと並行して画像を処理
  • シンキングモード - 推論深度を設定可能
  • マルチターンツール呼び出し - 複数の会話ターンにわたってツールを呼び出すエージェントを構築

Kimi K2.5 からの変更点

Kimi K2.5 から移行する場合は、以下の API 変更に注意してください:

  • K2.6 は推論を制御するために chat_template_kwargs.thinking を使用し、chat_template_kwargs.enable_thinking に置き換わります
  • K2.6 は推論コンテンツを reasoning フィールドで返し、reasoning_content に置き換わります

はじめに

Kimi K2.6 は以下を通じて使用できます:

  • Workers AI バインディング (env.AI.run())
  • /ai/run の REST API
  • /v1/chat/completions の OpenAI 互換エンドポイント

これらのエンドポイントのいずれかで AI Gateway を使用することもできます。詳細については、Kimi K2.6 モデルページ料金を参照してください。