超大型言語モデルを実行するための基盤構築Cloudflare / 2026/04/16PD分離で3x高速化キャッシュヒット60%→80%Infireで起動20秒未満prefill-decodekv-cachespeculative-decodinginfiremulti-gpusession-affinity
Workers AI - Moonshot AI Kimi K2.5 が Workers AI で利用可能になりましたCloudflare Developer Platform / 2026/03/19256k コンテキスト対応マルチターンツール呼び出し非同期バッチAPI(プル)workers-aikimi-k2.5prefix-cachingasync-apivision-inputsjson-schemasession-affinity