超大型言語モデルを実行するための基盤構築Cloudflare / 2026/04/16PD分離で3x高速化キャッシュヒット60%→80%Infireで起動20秒未満prefill-decodekv-cachespeculative-decodinginfiremulti-gpusession-affinity
エージェントを強化:Workers AIが大規模モデルの実行を開始、まずはKimi K2.5からCloudflare / 2026/03/19Kimi K2.5対応256kコンテキストプレフィックスキャッシュ強化workers-aikimi-k2.5prefix-cachingasync-apiinfireagents-sdklarge-models