infire Articles | DocsDigest

Matched posts: 2

Building the foundation for running extra-large language models

Cloudflare / Apr 16, 2026

PD分離で3x高速化
キャッシュヒット60%→80%
Infireで起動20秒未満

prefill-decode kv-cache speculative-decoding infire multi-gpu session-affinity

Powering the agents: Workers AI now runs large models, starting with Kimi K2.5

Cloudflare / Mar 19, 2026

Kimi K2.5対応
256kコンテキスト
プレフィックスキャッシュ強化

workers-ai kimi-k2.5 prefix-caching async-api infire agents-sdk large-models

Previous1 / 1Next