Summary

Moonshot AI の Kimi K2.6 が Workers AI で利用可能になりました。Mixture-of-Experts (1T 総パラメータ、トークンごとに32B アクティブ) を採用したネイティブなマルチモーダル・エージェントモデルで、長期コンテキスト、長尺コーディング、コーディング駆動の設計、プロアクティブな自律実行、スワーム型タスクオーケストレーションに強みがあります。エンジニア向けには大規模な会話履歴保持とエージェント運用向けの API 互換性がポイントです。

Key Points

アーキテクチャ・性能: MoE アーキテクチャ、総パラメータ 1T、32B アクティベーション/トークン。GPT-5.4 や Claude Opus 4.6 と競合するベンチマークスコア（BrowseComp 83.2、SWE-Bench Verified 80.2、Terminal-Bench 2.0：66.7）。
長大コンテキスト: 262.1k トークンのコンテキストウィンドウで会話履歴、ツール定義、コードベースを保持可能。
コーディング強化: 長尺かつエンドツーエンドのコーディング改善（Rust / Go / Python を含む）。
マルチモーダル & ツール: 画像入力対応、マルチターンでのツール呼び出し、思考モード（reasoning 深度の設定）を提供。
スワームオーケストレーション: 最大 300 サブエージェント、4,000 ステップ規模で水平スケールするタスク実行。

Migration / API 変更

chat_template_kwargs.enable_thinking は chat_template_kwargs.thinking に変更。
推論中の推論出力フィールド名が reasoning_content から reasoning に変更。
既存の Kimi K2.5 クライアントは上記フィールド名を置換してテストを推奨。

Usage (実務メモ)

利用方法: Workers AI バインディング（env.AI.run()）、REST: /ai/run、OpenAI 互換: /v1/chat/completions。
AI Gateway からもアクセス可能。まずはテストワークフローで長文コンテキストとマルチターンツール呼び出しを検証してください。

References

モデルページと価格情報を参照し、実運用でのコスト・レイテンシーを評価してください。

openaijamodel: gpt-5-mini-2025-08-07

Workers AI - Moonshot AI の Kimi K2.6 が Workers AI で利用可能に

Moonshot AI Kimi K2.6 が Workers AI に登場

公開日: 2026-04-20

Workers AI 上で @cf/moonshotai/kimi-k2.6 が利用可能になりました。Moonshot AI と提携し、Day 0 サポートを提供します。

Kimi K2.6 は Moonshot AI によるネイティブなマルチモーダル・エージェントモデルで、長期にまたがるコーディング、コーディング駆動のデザイン、プロアクティブな自律実行、およびスウォームベースのタスクオーケストレーションにおける実用的能力を進化させています。Mixture-of-Experts アーキテクチャ（合計 1T parameters、トークンあたり 32B active）を採用し、効率的な推論でフロンティア級の知能を提供します。

ベンチマーク実績（抜粋）:

BrowseComp: 83.2
SWE-Bench Verified: 80.2
Terminal-Bench 2.0: 66.7

GPT-5.4 や Claude Opus 4.6 と競合するスコアを示し、特にエージェント的タスクやコーディングベンチマークで高い性能を発揮します。

主な機能

262.1k トークンのコンテキストウィンドウ：長時間にわたるエージェントセッションで会話履歴、ツール定義、コードベースを完全保持
長期コーディング：Rust、Go、Python を含む複数言語での複雑なエンドツーエンドコーディングタスクに対する大幅な改善
コーディング駆動デザイン：シンプルなプロンプトや視覚入力からプロダクション対応のインターフェースやフルスタックワークフローを生成
エージェントスウォームオーケストレーション：水平スケールで最大 300 サブエージェント、4,000 ステップの協調実行による複雑な自律タスクの遂行
ビジョン入力：テキストと並行して画像を処理
Thinking モード：推論の深さを設定可能
マルチターンツールコーリング：複数ターンにわたってツールを呼び出すエージェントの構築をサポート

Kimi K2.5 からの差分（API 変更点）

chat_template_kwargs.thinking が推論制御に使用されます（旧: chat_template_kwargs.enable_thinking を置換）
推論コンテンツは reasoning フィールドで返されます（旧: reasoning_content を置換）

K2.5 から移行する場合は上記のフィールド名変更に注意してください。

利用開始

Kimi K2.6 は以下の方法で利用できます：

Workers AI バインディング（env.AI.run()）
REST API: /ai/run
OpenAI 互換エンドポイント: /v1/chat/completions

これらのいずれのエンドポイントでも AI Gateway を使用できます。詳しくは Kimi K2.6 のモデルページおよび pricing を参照してください。

参考・リソース

Kimi K2.6 モデルページおよび pricing（詳細は該当ページを参照）
API ドキュメント（Workers AI / REST / OpenAI 互換エンドポイント）

ご不明点があれば、Workers AI のドキュメントや Moonshot AI のサポートをご確認ください。

Workers AI - Moonshot AI Kimi K2.6 now available on Workers AI

要約