OpenAIOpenAI NewsMar 23, 2026, 12:00 AM

Creating with Sora Safely

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

openaienmodel: gpt-5-mini-2025-08-07

Creating with Sora Safely — key safety features and engineering considerations

Key Points

  • C2PA metadata plus visible/invisible provenance
  • Consent-based image-to-video and character controls
  • Layered moderation for visuals and audio

Summary

Sora 2 and the Sora app provide state-of-the-art video generation with safety built in across provenance, person likeness, teen protections, content filtering, and audio. Core protections include visible and invisible provenance signals (C2PA metadata, dynamic watermarks), consent-based controls for image-to-video and characters, layered moderation before and after generation, and user recourse tools.

Key Points

  • Provenance: Every Sora video embeds C2PA metadata and visible/invisible provenance signals; internal reverse-image and audio search tools can trace outputs to Sora. Dynamic watermarks often include creator names.
  • Image-to-video (real-person likeness): Users may create videos from photos only after attesting to consent/rights. Strict guardrails apply, with even tighter rules for children. Shared videos are watermarked.
  • Characters / consented likeness: Characters capture image and voice likeness under explicit user control. Owners can grant/revoke access, review drafts, delete/report videos, and enable stricter usage restrictions (appearance changes, embarrassing contexts, identity consistency).
  • Teen protections: Stronger content filtering for teen profiles, limits on mature output, restricted messaging (adults cannot initiate contact), parental controls (DMs, non-personalized feed), and default scroll limits.
  • Filtering and review: Multi-layer defenses block unsafe content at creation (prompt/output checks across frames and transcripts), automated feed scanning against Global Usage Policies, continuous updates, and prioritized human review.
  • Audio safeguards: Transcripts are scanned for policy violations; systems block prompts that imitate living artists or existing works and honor takedown requests.
  • User control & recourse: Users choose when to share, can remove published videos, report content/accounts, and block others. Clear reporting and takedown flows are maintained.

Practical implications for engineers

  • Preserve and surface C2PA metadata and watermarking in export/sharing pipelines; validate provenance on ingestion/archival paths.
  • Implement attestation capture and consent logs for image-to-video uploads; apply stricter moderation rules for real-person and underage inputs.
  • Ensure character access controls, revocation, visibility to owners, and audit trails for character usage and drafts.
  • Integrate transcript scanning and music-imitation detectors into audio generation pipelines; provide takedown APIs/workflows.
  • Wire automated pre/post-generation checks and human-review escalation paths; keep policies and detector models updatable.
  • Enforce UX-level constraints (forced watermarks on sharing, feed filters, DM restrictions for teens) and logging for audits and investigations.

Full Translation

Translations

A translation section that keeps the flow of the original article.

openaijamodel: gpt-5-mini-2025-08-07

Soraで安全に創作する

2026年3月23日 | 安全性

Sora 2モデルとSoraアプリは、共同創作の新しい方法を提供する最先端のビデオ生成機能を備えており、最初から安全性を組み込んでいます。私たちのアプローチは具体的な保護策に基づいています。

AI生成コンテンツの識別

  • すべてのSora生成ビデオには、可視・不可視の出所(provenance)シグナルが含まれます。
  • すべてのSoraビデオはC2PAメタデータ(業界標準の署名)を埋め込んでおり、内部の逆画像検索や音声検索ツールによって高い精度でSora由来の動画を追跡できます。これらはChatGPTの画像生成やSora 1での成功したシステムに基づいています。
  • 多くの出力には、作成者名を含む可視の動的ウォーターマークも付与されます。

実在人物のルックスを用いた画像→動画変換

  • 家族や友人の写真から動画を作成できるなど、創造的表現を強化しつつガードレールも厳格にしています。
  • ユーザーは、掲載されている人物から同意を得ており、メディアをアップロードする権利があることを宣誓した上で人物を含む画像をアップロードできます。
  • 人物を含む画像からの画像→動画生成には、特に厳しい安全ガードレールが適用されます。これはSora Characters(旧称:cameo feature)よりもさらに厳格です。
  • 子どもや若く見える人物を含む画像については、作成可能な内容に関してさらに厳しいモデレーションとガードレールが適用されます。
  • これらの動画は共有時に常にウォーターマークが付与されます。

キャラクターを使った同意ベースのルックス管理

  • Sora Characters(新しいウィンドウで開きます)は、Sora上で自分のルックス(外見や声)を強くコントロールできる機能です。
  • キャラクターに記録された音声や画像のルックスが同意のもとで使用されるよう、ガードレールを設けています。
  • キャラクターの使用権を与えるかどうかは本人のみが決定でき、いつでもアクセス権を取り消せます。
  • 公的な人物の描写は、キャラクター機能を使う場合を除き、ブロックする措置を取っています。
  • あなたのキャラクターを含むビデオ(他のユーザーが作成した下書きを含む)は常にあなたに表示されます。これにより、簡単に確認、削除(必要なら報告)できます。
  • キャラクターを含む映像には追加の安全ガードレールを適用しており、外見の大幅な変更や恥をかかせる状況への配置などを制限する、より厳しいガードレールを有効にすることもできます。

ティーン向けの保護策

  • Soraは若年ユーザー向けにより強力な保護を含み、成人向けの出力に制限を設けています。
  • フィードは全てのSoraユーザーに適した内容となるよう設計されており、危険または年齢不相応なコンテンツはティーンアカウント向けにフィルタリングされます。
  • ティーンプロフィールは大人向けには推奨されず、大人はティーンに対してメッセージを開始できません。
  • ChatGPTのペアレンタルコントロールを使って、保護者はティーンがDMを送受信できるかどうか、Soraアプリで非パーソナライズドフィードを選択するかを管理できます。
  • デフォルトで、ティーンにはSoraで連続スクロールできる量にも制限があります。

有害コンテンツのフィルタリング

  • Soraは多層の防御を用いてフィードの安全を保ちながら創造性の余地を残します。
  • 作成時には、プロンプトと出力の両方を複数のビデオフレームや音声のトランスクリプトにわたってチェックし、性的な内容、テロ宣伝、自傷行為の助長などの不安全なコンテンツを生成前にブロックしようとします。
  • 新たなリスクを探るためにレッドチーミング(攻撃想定テスト)を行い、Soraの高いリアリズムや動き・音声の追加を踏まえて画像生成時のポリシーを強化しています。
  • 生成後についても、自動化されたシステムがすべてのフィードコンテンツを当社のGlobal Usage Policiesに照らしてスキャンし、不安全または年齢不相応な素材をフィルタリングします。
  • これらのシステムは新たなリスクに応じて継続的に更新され、最も重大な害に焦点を当てた人間によるレビューで補完されています。

音声に関する安全対策

  • 音声の追加は安全性のハードルを上げるため、この分野へも真剣に投資を続けています。
  • Soraは生成された音声のトランスクリプトを自動でスキャンし、ポリシー違反のおそれがあるものを検出します。
  • 実在のアーティストや既存作品を模倣する音楽の生成試行はブロックされます。これらのプロンプトを検出して停止するよう設計しています。
  • 作品の権利者からの削除要請(takedown request)についても対応します。

ユーザーのコントロールと救済手段

  • 動画をいつ・どのように共有するかはユーザーが決定できます。公開したコンテンツはいつでも削除できます。
  • ビデオがフィードに公開されるのは、ユーザーが共有を選択した場合のみです。
  • すべてのビデオ、プロフィール、ダイレクトメッセージ、コメント、キャラクターは不正利用として報告できます。ポリシーが違反された場合の明確な救済措置があります。
  • アカウントをブロックすることで、他者があなたのプロフィールや投稿を見たり、あなたのキャラクターを使用したり、ダイレクトメッセージで連絡することを防げます。

Sora 2026

著: The Sora team

関連記事

  • How we monitor internal coding agents for misalignment — Safety — Mar 19, 2026
  • OpenAI Japan announces Japan Teen Safety Blueprint to put teen safety first — Safety — Mar 17, 2026
  • Reasoning models struggle to control their chains of thought, and that’s good — Research — Mar 5, 2026