OpenAIOpenAI News2026/03/25 0:00

Introducing the OpenAI Safety Bug Bounty program

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

openaijamodel: gpt-5-mini-2025-08-07

OpenAIのSafety Bug Bountyプログラムを開始

Key Points

  • 公開で調査可能
  • エージェント攻撃重視
  • 再現性50%以上

Summary

OpenAIは、AIの悪用や安全リスクを対象とした公開のSafety Bug Bountyプログラムを開始しました。従来のセキュリティ脆弱性とは別に、実害をもたらす可能性のある安全・悪用問題を受け付け、SafetyチームとSecurityチームでトリアージおよび必要に応じた振り分けを行います。

Key Points

  • 対象スコープ:
    • エージェントリスク(MCP含む)およびエージェントの乗っ取り(Browser、ChatGPT Agent等)
    • サードパーティのプロンプト注入やデータ持ち出し(データ流出)
    • OpenAIの専有情報に関する生成や露出
    • アカウント/プラットフォーム整合性(自動化回避、権限の不正獲得、制限の回避等)
  • 再現性要件: エージェントのハイジャックは少なくとも50%の再現性が必要
  • インスコープ条件: 実害が合理的に想定でき、対応可能な具体的修正手順やPoCを提示できる報告が対象
  • アウトオブスコープ: 単なるコンテンツポリシー回避(例:礼儀に欠ける応答や検索で容易に見つかる情報)のみを返す“jailbreak”など
  • レポートの実務チェックリスト: 再現手順、影響の定量/定性、PoC(リクエスト/レスポンス例・ログ・スクショ)、影響範囲、関連エンドポイント、第三者サービスを使う場合は当該TOS順守の確認
  • 参加方法: Safety Bug Bountyの申請ページから提出し、研究者・エシカルハッカーと連携して対応

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

openaijamodel: gpt-5-mini-2025-08-07

OpenAI Safety Bug Bounty プログラムの紹介

2026年3月25日 | 安全 | セキュリティ

OpenAI Safety Bug Bounty プログラムの紹介

OpenAIは本日、製品全体にわたるAIの悪用や安全リスクを特定することに特化した公開の Safety Bug Bounty プログラムを開始します。AI技術が急速に進化するにつれて、悪用の可能性も変化します。私たちの目標は、実際の危害につながり得る誤用や悪用に対して、システムが安全かつ堅牢であることを確保することです。

この新しいプログラムは、Security Bug Bounty を補完するもので、セキュリティ脆弱性の基準を満たさない場合でも、重要な悪用・安全リスクをもたらす問題を受け付けます。本プログラムを通じて、従来のセキュリティ脆弱性の範疇外にあるが実際にリスクを伴う問題の特定と対処に、セーフティおよびセキュリティ研究者と引き続き協力していきます。

提出された報告はOpenAIのSafetyチームおよびSecurity Bug Bountyチームによってトリアージされ、範囲や所有権に応じて両プログラム間で振り分けられる場合があります。

プログラム概要

Safety Bug Bounty プログラムは、以下に挙げるAI固有の安全シナリオに重点を置きます。

エージェント型リスク(MCPを含む)

  • サードパーティのプロンプトインジェクションおよびデータの持ち出し(data exfiltration):
    • 攻撃者のテキストが被害者のエージェント(Browser、ChatGPT Agent、同様のエージェント型製品を含む)を確実にハイジャックし、有害な操作を実行させる、またはユーザーの機密情報を漏洩させるケース。
    • 再現性は最低でも50%程度であることが求められます。
  • エージェント型のOpenAI製品がOpenAIのウェブサイト上でスケールに乗って許可されていない操作を実行するケース。
  • 上に挙げたもの以外で、エージェント型OpenAI製品が潜在的に有害な操作を行うケース(有効な報告は、実行可能で重要な被害を示す必要があります)。

注: MCPリスクのテストを行う場合、第三者の利用規約に従う必要があります。

OpenAIの専有情報

  • 推論に関連する専有情報を返すモデル生成。
  • 他のOpenAI専有情報を露呈させる脆弱性。

アカウントおよびプラットフォーム整合性

  • 反自動化制御の回避、アカウントの信頼シグナルの操作、アカウント制限/停止/禁止の回避など、アカウント整合性やプラットフォーム整合性シグナルに関する脆弱性。
  • ユーザーが認可されていない権限を超えて機能、データ、あるいは機能性にアクセスできるようにする問題は Security Bug Bounty に報告してください。

スコープ外の例と補足

  • 一般的なコンテンツポリシーのバイパスで、安全性や悪用への影響が実証されないものは本プログラムの範囲外です。
    • 例: モデルが下品な言葉を使用する、または検索エンジンで容易に見つかる情報を返すといった“jailbreak”は範囲外となります。
  • ただし、本プログラムで対象外となる「jailbreak」でも、特定の有害性タイプに焦点を当てたプライベートのバグバウンティキャンペーン(例: ChatGPT Agent と GPT‑5 における Biorisk コンテンツ問題)を定期的に実施しています。該当する場合、関心のある研究者はこれらのプログラムに応募してください。
  • 上記のカテゴリ外でも、研究者がユーザー被害に直結する明確な経路を示し、実行可能で具体的な修正手順を提供できる欠陥を特定した場合は、個別に報酬の対象として検討されることがあります。

参加方法

研究者で参加を希望する方は、Safety Bug Bounty プログラムを通じて申請してください。私たちは、研究者、エシカルハッカー、セーフティおよびセキュリティコミュニティと協力し、安全なAIエコシステムの実現に向けて取り組むことを楽しみにしています。


著者: OpenAI

関連投稿:

  • 開発者がティーン向けにより安全なAI体験を構築する手助け (Safety) — 2026年3月24日
  • Soraを安全に使って創作する方法 (Safety) — 2026年3月23日
  • 内部コーディングエージェントの不整合をどのように監視しているか (Safety) — 2026年3月19日