infire の記事一覧 | DocsDigest

一致した記事数: 2

超大型言語モデルを実行するための基盤構築

Cloudflare / 2026/04/16

PD分離で3x高速化
キャッシュヒット60%→80%
Infireで起動20秒未満

prefill-decode kv-cache speculative-decoding infire multi-gpu session-affinity

エージェントを強化：Workers AIが大規模モデルの実行を開始、まずはKimi K2.5から

Cloudflare / 2026/03/19

Kimi K2.5対応
256kコンテキスト
プレフィックスキャッシュ強化

workers-ai kimi-k2.5 prefix-caching async-api infire agents-sdk large-models

前へ1 / 1次へ