次世代サイバー防御のための信頼できるアクセス
私たちは、信頼できるアクセス、セーフガード、およびエコシステムサポートを継続的に進化させ、サイバー防御者が私たち全員を保護するのを支援しています。
概要
私たちは、Trusted Access for Cyber(TAC)プログラムを数千人の検証済み個人防御者と、重要なソフトウェアを防御する責任を持つ数百のチームにスケールアップしています。
数年間、民主化されたアクセス、反復的なデプロイメント、およびエコシステムの回復力の原則に基づいてサイバー防御プログラムを構築してきました。今後数ヶ月間、OpenAIからより高度なモデルが登場することに備えて、防御的なサイバーセキュリティユースケースを実現するために、モデルを微調整しています。本日より、GPT‑5.4の亜種であるGPT‑5.4‑Cyberの提供を開始します。このモデルはサイバー許容的になるよう訓練されています。
この投稿では、増加するモデル機能に合わせてサイバー防御をスケールアップするアプローチが、将来のリリースのテストとデプロイメントをどのように導くかについて説明します。
AIの進化的な使用
AIの段階的な使用は防御者(システム、データ、ユーザーの安全を保つ責任を持つ者)を加速させ、デジタルインフラストラクチャの問題をより迅速に発見・修正できるようにします。同様に、AIは害をもたらそうとする攻撃者によっても使用されています。
私たちはこれに備えてきました:
- 2023年以降:サイバーセキュリティグラントプログラムを通じて防御者をサポートし、Preparedness Frameworkを通じてセーフガードを強化
- 2025年:モデルのサイバー機能の評価を開始し、モデルデプロイメントにサイバー固有のセーフガードを含める
- 本年初め:Codex Securityを立ち上げ、脆弱性を大規模に特定・修正するサポートを強化
3つの基本原則
民主化されたアクセス
目標は、これらのツールを可能な限り広く利用可能にしながら、悪用を防ぐことです。正当な使用と不正な使用を恣意的に区別するのではなく、明確で客観的な基準と方法(強力なKYCと身元確認など)を使用して、より高度な機能にアクセスできるユーザーを決定し、これらのプロセスを時間とともに自動化します。
最終的には、重要なインフラストラクチャ、公共サービス、および人々が毎日依存するデジタルシステムを保護する責任を持つ大規模および小規模な正当なアクターを含む、すべての正当なアクターが高度な防御機能を利用できるようにすることを目指しています。
反復的なデプロイメント
私たちは、これらのシステムを慎重に世界に展開し、時間とともに改善することで最も多くを学びます。機能とリスクの両方をより深く理解するにつれて、モデルとセーフガードシステムを相応に更新します。これには、特定のモデルの差別化された利点とリスクの理解、ジェイルブレイクおよび他の敵対的攻撃への耐性の向上、防御機能の改善が含まれます。
エコシステムの回復力への投資
信頼できるアクセスパスウェイ、対象を絞ったグラント、オープンソースセキュリティイニシアティブへの貢献、およびCodex Securityなどのテクノロジーを通じて、防御者のコミュニティをサポートし、加速させます。
サイバーセキュリティの回復力と防御加速のための戦略
信念
サイバーリスクは既に存在し、加速していますが、私たちは行動できます
デジタルインフラストラクチャは、高度なAIが登場する前から数年間、既に脆弱でした。現在、既存のモデルは脆弱性を発見し、コードベース全体を推論し、サイバーワークフローの意味のある部分をサポートでき、脅威アクターはAI駆動の新しいアプローチを試験しています。
使用者と使用方法に基づいてアクセスを拡大する
サイバー機能は本質的にデュアルユースであるため、リスクはモデルだけでは定義されません。また、ユーザー、ユーザーの周囲の信頼シグナル、および与えられるアクセスレベルにも依存します。
防御は機能の増加に合わせて継続的にスケールする必要があります
モデル機能が増加するにつれて、防御も同時にスケールする必要があります。エージェント型コーディングの着実な改善が見られ、これはサイバーセキュリティに直接的な影響を与えており、私たちはそれに応じてアプローチを適応させています。
ソフトウェア開発自体をより安全にする必要があります
最も強力なエコシステムは、ソフトウェアが作成されるときに継続的にセキュリティ問題を特定、検証、修正するものです。
Trusted Access for Cyberとその拡大
2月、自動化された身元確認を備えたTrusted Access for Cyber(TAC)を導入し、サイバーセキュリティ関連のタスクに対するセーフガードの摩擦を軽減し、より許容的なサイバーモデルのための限定的な組織セットとパートナーシップを結びました。
本日、OpenAIと協力してサイバーセキュリティ防御者として自分たちを認証する意思のあるユーザーのための追加のアクセス層を導入することで、このプログラムを拡大しています。
GPT‑5.4‑Cyber
最高層のお客様はGPT‑5.4‑Cyberにアクセスできます。これは追加のサイバー機能のために意図的に微調整され、機能制限が少ないモデルです。
これはGPT‑5.4の亜種で、正当なサイバーセキュリティ作業の拒否境界を低下させ、バイナリリバースエンジニアリング機能を含む高度な防御ワークフローのための新しい機能を有効にします。セキュリティプロフェッショナルは、ソースコードへのアクセスなしに、マルウェアの可能性、脆弱性、セキュリティの堅牢性についてコンパイル済みソフトウェアを分析できます。
このモデルはより許容的であるため、検証済みのセキュリティベンダー、組織、および研究者への限定的で反復的なデプロイメントから開始しています。
アクセス方法
個人ユーザー:chatgpt.com/cyberで身元を確認できます
エンタープライズ:OpenAI担当者を通じてチームの信頼できるアクセスをリクエストできます
このプロセスを通じて承認されたすべてのお客様は、デュアルユースサイバーアクティビティでトリガーされる可能性のあるセーフガードの周囲の摩擦が軽減されたモデルのバージョンにアクセスでき、セキュリティ教育、防御的プログラミング、および責任ある脆弱性研究をサポートし続けることができます。
今後の展開
サイバーセキュリティ防御は、数ヶ月間の反復的な改善の結果です。現在使用されているセーフガードのクラスは、現在のモデルの広範なデプロイメントをサポートするのに十分なサイバーリスクを軽減すると考えています。
今後のより強力なモデルについては、これらのセーフガードのバージョンが十分であると予想していますが、サイバーセキュリティ作業のために明示的に訓練され、より許容的にされたモデルは、より制限的なデプロイメントと適切なコントロールが必要です。
長期的には、サイバーセキュリティにおけるAI安全性の継続的な十分性を確保するために、今日の最高の目的別モデルの機能さえも急速に超える将来のモデルのための、より拡張的な防御の必要性も予想しています。