ClaudeOpenAI News2026/03/24 11:00

Helping developers build safer AI experiences for teens

要点だけを先に読めるように短く再構成したセクションです。

元記事

Quick Digest

要約

要点だけを先に読めるように短く再構成したセクションです。

claudejamodel: claude-sonnet-4-20250514

開発者向けティーン向けAI安全体験構築支援ツールのリリース

Key Points

  • ティーン向けAI安全ポリシーをプロンプト形式でオープンソース公開
  • gpt-oss-safeguardモデルと連携した6つの主要リスク領域対応
  • 外部専門機関と協力してティーンの発達的特性を考慮した設計

Summary

OpenAIが2026年3月24日、開発者がティーン向けの安全なAI体験を構築するためのプロンプトベース安全ポリシーをリリースしました。これらのポリシーは、オープンウェイト安全モデルgpt-oss-safeguardと連携して動作し、開発者が安全要件を実用的な分類器に変換することを簡素化します。

Key Points

  • 6つの主要リスク領域をカバー

    • グラフィックな暴力的コンテンツ
    • グラフィックな性的コンテンツ
    • 有害な身体イメージと行動
    • 危険な活動とチャレンジ
    • ロマンチックまたは暴力的なロールプレイ
    • 年齢制限商品・サービス
  • 外部専門家との協力

    • Common Sense Mediaとeveryone.aiからの専門知識を活用
    • ティーンの発達的差異に関する既存研究をベースに開発
  • オープンソースでの提供

    • ROOST Model Communityを通じて公開
    • 開発者による適応・拡張・多言語化が可能
    • リアルタイムコンテンツフィルタリングとオフライン分析の両方に対応

Full Translation

翻訳

原文の流れを保ったまま読める翻訳セクションです。

claudejamodel: claude-sonnet-4-20250514

開発者がティーンエイジャー向けのより安全なAI体験を構築できるよう支援

開発者がティーンエイジャー向けのより安全なAI体験を構築できるよう支援

2026年3月24日 安全性

gpt-oss-safeguard向けにプロンプト形式で構成されたティーンエイジャー安全性ポリシーセットの導入

本日、開発者がティーンエイジャー向けの年齢に適した保護機能を作成できるよう支援するため、プロンプトベースの安全性ポリシーをリリースします。オープンウェイト安全性モデルであるgpt-oss-safeguardと連携するよう構築されたこれらのポリシーは、開発者が安全性要件を実世界のシステムで使用可能な分類器に変換する方法を簡素化します。

私たちは、強力なAIへのアクセスを民主化し、幅広いイノベーションを支援するためにオープンウェイトモデルをリリースしました。同時に、安全性とイノベーションは密接に関連しており、開発者は高性能なモデルだけでなく、それらを安全かつ責任を持って展開するためのツールとポリシーにもアクセスできるべきだと考えています。

私たちは、Common Sense Mediaやeveryone.aiなどの信頼できる外部組織からの意見を取り入れて、若いユーザーを保護する開発者の安全性への取り組みを支援するためにこれらのポリシーを開発しました。

ティーンエイジャーと大人では異なるニーズがあり、ティーンエイジャーには追加の保護が必要であることを認識しています。これらのポリシーは、開発者がそうした違いを考慮し、若いユーザーにとって力を与えると同時に適切な体験を構築できるよう支援するために設計されています。

若者を保護するための幅広い取り組みの基盤

私たちは長い間、若者の機会を拡大しながら安全を保つAIの構築にコミットしてきました。この取り組みの一環として、OpenAIのモデルの意図された動作を定義するガイドラインであるModel Specを更新してUnder-18(U18)原則を含め、若いユーザーをより良く保護するためのペアレンタルコントロールや年齢予測などの製品レベルの保護機能を導入しました。また、Teen Safety Blueprintを通じて業界全体の保護を呼びかけてきました。

本日のリリースは、その基盤の上に構築されています。私たちは、開発者がティーンエイジャー向けの安全性保護を展開することを支援し、オープンウェイトエコシステム全体でのアクセスの民主化を支援するために、これらの安全性ポリシーを開発者に提供しています。

ティーンエイジャーの安全性を明確で使用可能なポリシーに変換

gpt-oss-safeguardのような安全性分類器は有害なコンテンツを検出できますが、そのコンテンツが何であるかの明確な定義に依存しています。実際には、開発者が直面する最大の課題の一つは、ティーンエイジャー特有のリスクを正確に捉え、実際のシステムで一貫して適用できるポリシーを定義することです。経験豊富なチームでさえ、高レベルの安全性目標を正確で運用可能なルールに変換することに苦労することが多く、特に専門知識と深いAI知識の両方が必要なためです。これは保護のギャップ、一貫性のない実施、または過度に広範なフィルタリングにつながる可能性があります。

明確で適切に範囲が定められたポリシーは、効果的な安全性システムの重要な基盤です。

開発者のティーンエイジャー安全性の運用化を支援

この課題に対処するため、私たちはティーンエイジャーが直面する一般的なリスクに合わせて調整され、ティーンエイジャーの独特な発達上の違いに関する既存の研究の慎重な検討に基づいた安全性ポリシーセットをリリースします。これらのポリシーは、gpt-oss-safeguardやその他の推論モデルで直接使用できるプロンプトとして構造化されており、開発者がシステム全体で一貫した安全性基準をより簡単に適用できるようになります。

初回リリースには、以下をカバーするポリシーが含まれています:

  • グラフィックな暴力的コンテンツ
  • グラフィックな性的コンテンツ
  • 有害な身体理想と行動
  • 危険な活動とチャレンジ
  • ロマンチックまたは暴力的なロールプレイ
  • 年齢制限のある商品とサービス

これらのポリシーは、リアルタイムのコンテンツフィルタリングだけでなく、ユーザー生成コンテンツのオフライン分析にも使用できます。ポリシーをプロンプトとして構造化することで、開発者は既存のワークフローにより簡単に統合し、使用ケースに適応させ、時間をかけて反復することができます。

外部専門家の意見を取り入れて開発

私たちは、これらのポリシーの開発を知らせるために、Common Sense Mediaやeveryone.aiなどの外部組織と協力しました。彼らの専門知識は、カバーするコンテンツの範囲を形成し、プロンプトの構造を強化し、それらを評価する際に考慮すべきエッジケースを洗練するのに役立ちました。この作業は、AIシステムが若者をどのように支援するかを改善するために、専門家やより広いエコシステムと協力する継続的な取り組みを反映しています。

「ティーンエイジャー向けのAI安全性における最大のギャップの一つは、開発者が構築できる明確で運用可能なポリシーの欠如でした。多くの場合、開発者はゼロから始めています。これらのプロンプトベースのポリシーは、エコシステム全体で意味のある安全性の基準を設定するのに役立ち、オープンソースとしてリリースされているため、時間をかけて適応・改善することができます。この種のインフラストラクチャが広く利用可能になることを嬉しく思い、業界全体でより多くの共有された若者安全性の出発点を促進することを期待しています。」 — Robbie Torney氏、AI・デジタル評価責任者、Common Sense Media

「若者の安全性ポリシーをより運用可能にするこのような取り組みは、専門知識を実際のシステムで使用できるガイダンスに変換するのに役立つため価値があります。コンテンツポリシーは重要な第一歩であり、モデルの動作が時間をかけて若者関連のリスクをどのように形成できるかについてのより広範な作業への扉も開きます。この作業と私たち自身の研究に触発されて、everyone.aiは排他性や過度の依存などのリスクに焦点を当てた初期の行動ポリシーも作成しました。」 — Dr. Mathilde Cerioli氏、everyone.AIチーフサイエンティスト

出発点であり、完全な解決策ではない

これらのポリシーは出発点として意図されており、ティーンエイジャーの安全性の包括的または最終的な定義や保証ではありません。各アプリケーションには独特のリスク、対象者、コンテキストがあり、開発者は自分たちの製品やAI統合が提示する可能性のあるリスクを理解するのに最適な立場にあります。

私たちは、開発者が特定のニーズに基づいてこれらのポリシーを適応・拡張し、製品設計の決定、ユーザーコントロール、ティーンエイジャーに優しい透明性、監視システム、思慮深く年齢に適した対応などの他の保護機能と組み合わせることを強く推奨します。私たちは、より安全なAIシステムを構築するために、多層防御アプローチが不可欠だと考えています。

これらのポリシーは私たちの内部経験から引き出されていますが、OpenAIの内部ポリシーや保護機能の全範囲を反映するものではありません。

今後の道のり

私たちは、協力と反復を促進するために、ROOST Model Communityを通じてこれらのポリシーをオープンソースとしてリリースしています。貢献、フィードバックの提供、または追加のティーンエイジャー安全性ポリシーの共有については、RMC GitHubリポジトリをご覧ください。

開発者と組織は、これらのポリシーを特定のアプリケーションに適応させ、異なる言語に翻訳し、追加のリスク領域をカバーするよう拡張することができます。時間をかけて、これがAIシステムでの安全性ポリシーの実装のためのより堅牢で共有された基盤に貢献することを期待しています。

gpt-oss-safeguardを開始するには、Hugging Faceからダウンロードしてください。