OpenAICloudflare Developer PlatformMay 8, 2026, 12:00 AM

Workers AI - Planned model deprecations on Workers AI

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Workers AI — Planned model deprecations (May 30, 2026)

Key Points

  • Deprecation date: 2026-05-30
  • Kimi K2.5 will alias to K2.6
  • Update model IDs before deprecation

Summary

Cloudflare is refreshing the Workers AI model catalog and will deprecate a number of models on 2026-05-30. Remove references to deprecated model IDs before that date. @cf/moonshotai/kimi-k2.5 has an extended deprecation date and will be automatically aliased to @cf/moonshotai/kimi-k2.6 on 2026-05-30 (note the higher price for K2.6).

Key Points

  • Action required: update application code, configs, and infra to stop using deprecated model IDs before 2026-05-30.
  • Kimi K2.5: requests will be aliased to @cf/moonshotai/kimi-k2.6 on 2026-05-30 — review k2.6 pricing and capabilities and test behavior before the cutover.
  • Recommended replacements (examples): @cf/zai-org/glm-4.7-flash, @cf/google/gemma-4-26b-a4b-it, @cf/moonshotai/kimi-k2.6.
  • Scope: the deprecation list includes multiple Llama, Mistral, Gemma, Phi-2, SQLCoder, UForm, and BART variants — consult the Workers AI model catalog for the full list.
  • LoRA and -fast variants: many -fast and -lora variants remain active now (e.g. -lora and -fast suffixes listed), but LoRA models may be deprecated in the future — plan for retraining/migration of LoRAs.
  • Testing & validation: run integration tests for tool-calling, vision, and pricing changes; update CI and deployment manifests to reference replacement models.

For the complete model list and pricing details, refer to the Workers AI model catalog and Workers AI pricing pages.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Workers AI — Workers AI のモデル廃止予定

Workers AI のモデル廃止予定

公開日: 2026-05-08

概要

カタログを更新し、より新しいリリース用のスペースを確保するため、Workers AI のモデルカタログを刷新します。下記に記載されたモデルは廃止予定です。廃止日より前にアプリからこれらのモデルへの参照を削除するようアップデートしてください。

推奨置換モデル

  • @cf/zai-org/glm-4.7-flash — マルチリンガルでマルチターンのツールコールやコーディング機能を備えた高速モデル
  • @cf/google/gemma-4-26b-a4b-it — ビジョンとツールコールに対応した効率的なオープンモデル
  • @cf/moonshotai/kimi-k2.6 — エージェント処理やコーディング向けのツールコールとビジョンに対応する高能力モデル

価格については Workers AI pricing page を参照してください。

Kimi K2.5 に関する注意

当初 Kimi K2.5 は 2026-05-10 に廃止されると告知していましたが、廃止日を 2026-05-30 へ延長しました。2026-05-30 にはリクエストは自動的に @cf/moonshotai/kimi-k2.6 にエイリアスされます。@cf/moonshotai/kimi-k2.6 は価格が高くなっていますので、2026-05-30 より前に @cf/moonshotai/kimi-k2.6 の価格とモデルの能力を確認し、要件に合うかご判断ください。

廃止予定のモデル(2026-05-30)

  • @cf/moonshotai/kimi-k2.5 --> @cf/moonshotai/kimi-k2.6
  • @hf/meta-llama/meta-llama-3-8b-instruct
  • @cf/meta/llama-3-8b-instruct
  • @cf/meta/llama-3-8b-instruct-awq
  • @cf/meta/llama-3.1-8b-instruct
  • @cf/meta/llama-3.1-8b-instruct-awq
  • @cf/meta/llama-3.1-70b-instruct
  • @cf/meta/llama-2-7b-chat-int8
  • @cf/meta/llama-2-7b-chat-fp16
  • @cf/mistral/mistral-7b-instruct-v0.1
  • @hf/mistral/mistral-7b-instruct-v0.2
  • @hf/google/gemma-7b-it
  • @cf/google/gemma-3-12b-it
  • @hf/nousresearch/hermes-2-pro-mistral-7b
  • @cf/microsoft/phi-2
  • @cf/defog/sqlcoder-7b-2
  • @cf/unum/uform-gen2-qwen-500m
  • @cf/facebook/bart-large-cnn

アクティブのまま残るバリアント

-fast および -lora バリアントは引き続きアクティブな状態を維持します。例:

  • @cf/meta/llama-3.3-70b-instruct-fp8-fast
  • @cf/meta/llama-3.1-8b-instruct-fast
  • @cf/google/gemma-7b-it-lora
  • @cf/google/gemma-2b-it-lora
  • @cf/mistral/mistral-7b-instruct-v0.2-lora
  • @cf/meta-llama/llama-2-7b-chat-hf-lora

LoRA (lora) モデルは将来的に廃止される可能性があります。カタログに対して LoRA 機能を追加しており、新しい LoRA モデルが公開される際には告知を行い、古い LoRA を廃止する前にユーザーが新しい LoRA をトレーニングする時間を確保できるようにします。

利用可能なモデルの完全なリストについては Workers AI model catalog を参照してください。