OpenAICloudflare Developer Platform2026/06/05 0:00

AI Gateway - Control AI costs with spend limits

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

AI Gateway:支出上限でAIコストを制御

Key Points

  • 実利用金額で制限
  • モデル/プロバイダでスコープ
  • 固定/スライディング窓対応

Summary

AI Gatewayに「支出上限(spend limits)」が追加されました。トークン使用量とモデルの価格を基に累積ドル支出を追跡し、予算を超えると該当リクエストをブロックします。レート制限とは異なり、回数ではなく実際のコストを基準に管理できます。設定はモデル別・プロバイダ別・カスタムメタデータなどでスコープ可能です。

Key Points

  • 支出上限は実利用コストを集計し、予算超過時にリクエストをブロックする
  • スコープ例:ユーザーごと($200/日)、ゲートウェイ合計($10,000/日)、特定モデルのユーザー毎($50/日)
  • 時間窓は固定またはスライディングで設定可能
  • Unified Billing および既知価格のモデルに対する BYOK リクエストに対応
  • エンジニア向けの運用ポイント:しきい値設計、モニタリング/通知、テストで遮断挙動を確認する

詳細はドキュメント(Spend limits)を参照してください。

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

AI Gateway — Spend limits(支出上限)でAIコストを管理

AI Gateway — Spend limits(支出上限)でAIコストを管理

公開日: 2026-06-05

AI Gateway は現在、Spend limits をサポートしています。Spend limits は累積ドル支出を追跡し、予算を超えた場合にリクエストをブロックするコストベースの予算機能です。

レート制限がリクエスト数を上限するのに対し、Spend limits はトークン使用量とモデルの価格に基づいて実際のコストを追跡します。モデル、プロバイダ、カスタムメタデータの次元で制限をスコープできます。例えば:

  • 各ユーザーに $200/日 の予算を付与する
  • ゲートウェイ全体の合計支出を $10,000/日 に上限する
  • 特定のモデルをユーザーごとに $50/日 に制限する

各ルールは固定またはスライディングの適用を持つ、構成可能な時間ウィンドウを使用します。

Spend limits は、既知の価格があるモデルに対して、Unified Billing と BYOK リクエストの両方で動作します。

詳細は Spend limits ドキュメントを参照してください。

リソース

  • Resources
  • API
  • Cloudflare を初めてご利用ですか?
  • Directory
  • Sponsorships
  • Open Source
  • Cloudflare Research
  • Support
  • Help Center
  • System Status
  • Compliance
  • GDPR

会社・ツール

  • cloudflare.com
  • Our team
  • Careers
  • Tools
    • Cloudflare Radar
    • Cloudflare Labs
    • Speed Test
    • Is BGP Safe Yet?
    • Certificate Transparency

コミュニティ

  • Community forum
  • X
  • Discord
  • YouTube
  • GitHub

© 2026 Cloudflare, Inc. プライバシーポリシー | 利用規約 | セキュリティ問題の報告 | 商標 | Cookie 設定

この情報は役に立ちましたか? はい / いいえ