Workers AI:Moonshot AI Kimi K2.6 が利用可能に
Key Points
- 262.1k トークン文脈
- 1T MoE・32B 活性化
- API: thinking / reasoning 変更
Summary
Moonshot AI の Kimi K2.6 が Workers AI で利用可能になりました。Mixture-of-Experts (1T 総パラメータ、トークンごとに32B アクティブ) を採用したネイティブなマルチモーダル・エージェントモデルで、長期コンテキスト、長尺コーディング、コーディング駆動の設計、プロアクティブな自律実行、スワーム型タスクオーケストレーションに強みがあります。エンジニア向けには大規模な会話履歴保持とエージェント運用向けの API 互換性がポイントです。
Key Points
- アーキテクチャ・性能: MoE アーキテクチャ、総パラメータ 1T、32B アクティベーション/トークン。GPT-5.4 や Claude Opus 4.6 と競合するベンチマークスコア(BrowseComp 83.2、SWE-Bench Verified 80.2、Terminal-Bench 2.0:66.7)。
- 長大コンテキスト: 262.1k トークンのコンテキストウィンドウで会話履歴、ツール定義、コードベースを保持可能。
- コーディング強化: 長尺かつエンドツーエンドのコーディング改善(Rust / Go / Python を含む)。
- マルチモーダル & ツール: 画像入力対応、マルチターンでのツール呼び出し、思考モード(reasoning 深度の設定)を提供。
- スワームオーケストレーション: 最大 300 サブエージェント、4,000 ステップ規模で水平スケールするタスク実行。
Migration / API 変更
- chat_template_kwargs.enable_thinking は chat_template_kwargs.thinking に変更。
- 推論中の推論出力フィールド名が reasoning_content から reasoning に変更。
- 既存の Kimi K2.5 クライアントは上記フィールド名を置換してテストを推奨。
Usage (実務メモ)
- 利用方法: Workers AI バインディング(env.AI.run())、REST: /ai/run、OpenAI 互換: /v1/chat/completions。
- AI Gateway からもアクセス可能。まずはテストワークフローで長文コンテキストとマルチターンツール呼び出しを検証してください。
References
- モデルページと価格情報を参照し、実運用でのコスト・レイテンシーを評価してください。