ClaudeCloudflare Developer PlatformMay 8, 2026, 12:00 AM

Workers AI - Planned model deprecations on Workers AI

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

claudeenmodel: claude-haiku-4-5

Workers AI Model Deprecations - May 2026

Key Points

  • 17 models deprecated on May 30, 2026
  • Kimi K2.5 auto-aliases to K2.6 with higher pricing
  • Fast and LoRA variants remain active

Summary

Cloudflare is refreshing the Workers AI model catalog by deprecating older models on May 30, 2026. Applications must be updated to remove references to deprecated models and migrate to recommended replacements before the deadline.

Key Points

  • Deprecation Date: May 30, 2026 for most models; Kimi K2.5 extended from May 10 to May 30, 2026
  • Automatic Aliasing: Kimi K2.5 requests will automatically route to Kimi K2.6 (note: higher pricing)
  • Recommended Replacements:
    • GLM-4.7-Flash: fast multilingual model with tool calling and coding
    • Gemma-4-26b: efficient open model with vision and tool calling
    • Kimi K2.6: capable tool-calling and vision model for agentic workloads
  • Active Variants: Fast and LoRA variants remain active (e.g., llama-3.3-70b-instruct-fp8-fast, gemma-7b-it-lora)
  • Affected Models: 17 base models deprecated including Llama 3/3.1, Mistral, Gemma, Phi-2, and others
  • Action Required: Review pricing and capabilities of replacement models before May 30, 2026

Resources

Refer to the Workers AI model catalog and pricing page for complete details.

Full Translation

Translations

A translation section that keeps the flow of the original article.

claudejamodel: claude-haiku-4-5

Workers AI - 予定されているモデルの廃止予定

Workers AI モデルカタログをリフレッシュして、新しいリリースのための領域を確保しています。廃止予定日までに、以下にリストされているモデルへの参照を削除するようにアプリを更新してください。

推奨される置き換え

  • @cf/zai-org/glm-4.7-flash — 高速な多言語モデルで、マルチターンツール呼び出しとコーディング機能を備えています。
  • @cf/google/gemma-4-26b-a4b-it — ビジョンとツール呼び出し機能を備えた効率的なオープンモデル。
  • @cf/moonshotai/kimi-k2.6 — エージェント型ワークロードとコーディング向けの強力なツール呼び出しとビジョンモデル。

価格については、Workers AI 価格ページを参照してください。

Kimi K2.5

元々 Kimi K2.5 は 2026 年 5 月 10 日に廃止予定でしたが、廃止予定日を 2026 年 5 月 30 日に延長しました。2026 年 5 月 30 日に、リクエストは自動的に Kimi K2.6 にエイリアスされます。Kimi K2.6 はより高い価格です。2026 年 5 月 30 日までに @cf/moonshotai/kimi-k2.6 の価格とモデル機能を確認して、モデルがニーズに適していることを確認してください。

2026 年 5 月 30 日に廃止予定のモデル

  • @cf/moonshotai/kimi-k2.5 → @cf/moonshotai/kimi-k2.6
  • @hf/meta-llama/meta-llama-3-8b-instruct
  • @cf/meta/llama-3-8b-instruct
  • @cf/meta/llama-3-8b-instruct-awq
  • @cf/meta/llama-3.1-8b-instruct
  • @cf/meta/llama-3.1-8b-instruct-awq
  • @cf/meta/llama-3.1-70b-instruct
  • @cf/meta/llama-2-7b-chat-int8
  • @cf/meta/llama-2-7b-chat-fp16
  • @cf/mistral/mistral-7b-instruct-v0.1
  • @hf/mistral/mistral-7b-instruct-v0.2
  • @hf/google/gemma-7b-it
  • @cf/google/gemma-3-12b-it
  • @hf/nousresearch/hermes-2-pro-mistral-7b
  • @cf/microsoft/phi-2
  • @cf/defog/sqlcoder-7b-2
  • @cf/unum/uform-gen2-qwen-500m
  • @cf/facebook/bart-large-cnn

アクティブなままのバリアント

-fast および -lora バリアントはアクティブなままです。以下を含みます:

  • @cf/meta/llama-3.3-70b-instruct-fp8-fast
  • @cf/meta/llama-3.1-8b-instruct-fast
  • @cf/google/gemma-7b-it-lora
  • @cf/google/gemma-2b-it-lora
  • @cf/mistral/mistral-7b-instruct-v0.2-lora
  • @cf/meta-llama/llama-2-7b-chat-hf-lora

LoRA モデルは将来廃止される可能性があります。カタログに LoRA 機能をさらに追加し、新しい LoRA モデルがオンラインになるときに通知して、古いものを廃止する前にユーザーが新しい LoRA をトレーニングする時間を確保します。

利用可能なモデルの完全なリストについては、Workers AI モデルカタログを参照してください。