ClaudeOpenAI NewsMay 6, 2026, 8:00 AM

How ChatGPT learns about the world while protecting privacy

A condensed section focused on the key takeaways first.

Original Post

Quick Digest

Summary

A condensed section focused on the key takeaways first.

claudeenmodel: claude-haiku-4-5

ChatGPT Model Training and Privacy Protection: User Controls and Safeguards

Key Points

  • Privacy Filter masks personal information at multiple training stages
  • Users can opt-out of model training via Data Controls settings
  • Temporary Chat conversations excluded from model improvement

Summary

OpenAI has published a comprehensive guide on how ChatGPT learns from diverse data sources while maintaining privacy protections. The company uses a combination of publicly available information, partnership data, and user-generated content to train models, while implementing state-of-the-art privacy safeguards to prevent personal information leakage.

Key Points

  • Training Data Sources: Models are trained on publicly accessible internet content, partnership data, and user/contractor-provided information to build broad world knowledge
  • Privacy Filter Technology: OpenAI's Privacy Filter identifies and masks personal information at multiple training stages and is more effective than comparable tools; also available free to other developers
  • User Privacy Controls: Users can disable "Improve the model for everyone" in Settings > Data Controls to prevent conversations from training future models
  • Temporary Chat Option: Conversations in Temporary Chat mode are not used for model improvement, don't appear in history, and are deleted after 30 days
  • Memory Feature: Optional memory functionality helps personalize responses while allowing users to review, edit, or delete saved information
  • Data Management: Users can export data, delete accounts, manage controls, and submit privacy requests through OpenAI's privacy portal
  • Output Safety: ChatGPT is designed to reject requests for sensitive personal information, with a privacy request process for addressing inaccurate or inappropriate outputs
  • Responsibility Framework: Privacy protection and safety risk mitigation work together as core design principles

Full Translation

Translations

A translation section that keeps the flow of the original article.

claudejamodel: claude-haiku-4-5

ChatGPTが世界について学習しながらプライバシーを保護する方法

モデルトレーニング、プライバシー保護措置、およびChatGPTで利用可能なプライバシー選択肢についての平易な説明ガイド。

概要

ChatGPTはコーディング、研究、分析、ツール間の複数ステップタスクなど、複雑で実際の作業において人々を支援し、複数の領域でますます高い能力を発揮しています。これらの能力向上は、モデルが世界に関する幅広い知識を構築し、新しいタスクに適用するのに役立つ、多様なデータに対するトレーニングによって実現されています。OpenAIがフロンティアモデルの開発を続ける中、モデルトレーニングプロセスがプライバシーを尊重することを確保するために懸命に取り組んでいます。個人に関する私的情報ではなく、有用な一般的なパターンを学習するのに役立つ最先端技術を開発し、個人がデータを管理できるようにするための多数のユーザーコントロールとポリシーを備えています。

この記事では、モデルトレーニングで使用される可能性のある情報、そのプロセスで個人情報の処理をどのように削減するか、およびユーザーがChatGPT会話がモデルの改善に役立つかどうかを制御する方法について説明します。

トレーニングで使用される可能性のある情報

ChatGPTを動かすモデルを開発するために、公開されている情報、パートナーシップを通じてアクセスする情報、ユーザー、請負業者、および研究者によって提供または生成される情報を含む、様々な情報源の組み合わせを使用しています。このデータは、モデルが一般的な知識を構築し、より確実かつ安全に応答するのに役立ちます。

公開されているインターネットコンテンツについては、自由かつ公開的にアクセス可能な情報のみを使用しています。例えば、公開されているオンラインディスカッションフォーラムに参加したり、ブログやその他の公開投稿を投稿したりする場合、モデルトレーニング目的でそのような公開アクセス可能なコンテンツを使用する可能性があります。

トレーニングにおける個人情報の削減方法

情報がトレーニングに使用される前に、データセット内の個人情報を削減するために設計されたセーフガードを適用しています。これらのセーフガードの1つは、テキスト内の個人情報を識別およびマスクするOpenAI Privacy Filterです。当社の評価では、Privacy Filterは同種の他のツールよりも個人情報の削除に効果的です。

トレーニングプロセスの複数の段階でPrivacy Filterの内部バージョンを使用しており、トレーニングに使用する公開データセット、および「モデルをみんなのために改善する」が有効になっているユーザー会話に対しても使用しています。また、業界全体がワークフローでプライバシーを保護するのに役立つよう、Privacy Filterを他の開発者に無料で提供しています。

ChatGPTのプライバシーコントロール

ユーザーは、ChatGPTとの会話が将来のモデルのトレーニングに役立つかどうかを選択できます。ユーザーは設定に移動し、データコントロールに進んで、「モデルをみんなのために改善する」をオフにすることができます。この設定がオフになると、新しい会話はチャット履歴に表示されたままですが、ChatGPTのトレーニングには使用されません。

一時的なチャットは別のオプションを提供しています。開始するには、新しいチャットを開き、ページの右上隅にある「一時的」ボタンをクリックしてください。一時的なチャットはチャット履歴に表示されず、メモリを作成せず、モデルの改善には使用されません。会話は安全上の目的で30日間保持され、その後削除されます。

さらに、メモリ機能は、重要な人物、取り組んでいるプロジェクト、通常質問するトピックなど、ChatGPTに繰り返し思い出させたくない情報を記憶することで、ChatGPTの応答をより有用にします。これは常にオプションです。保存されたメモリを確認、編集、または削除するか、メモリを完全にオフにすることができます。オフになっている場合、ChatGPTは過去のチャットからメモリを保存または参照しません。

ユーザーはまた、ChatGPTデータをエクスポート、アカウントを削除、設定からデータコントロールを管理、およびプライバシーリクエストポータルを通じてプライバシーリクエストを送信することができます。

ユーザーは、使用または確認されることを望まない機密情報をChatGPTで共有しないでください。

応答でのプライバシー保護

ChatGPTは、個人に関する私的または機密情報のリクエストを拒否するように設計されています。ただし、エラーを犯す可能性があります。ChatGPT出力に誰かに関する個人情報が含まれており、それが不正確または不適切であると考える場合、プライバシーリクエストポータルを通じてリクエストを送信できます。

真摯に受け止める責任

人々はChatGPTをますます個人的な方法で使用しており、人生の機密部分に触れる可能性のある質問やタスクを含みます。その信頼に伴う深い責任を認識しています。ChatGPTを使用する人々を深く大切にしており、プライバシー保護は当社の構築方法の中心です。また、プライバシー保護と害の深刻なリスク対処が一緒に機能する必要があることも認識しています。この責任を真摯に受け止め、プライバシー保護措置を維持しながら暴力の信頼できる脅威を検出および対応する方法を継続的に強化しています。

モデルがより高い能力を備えるようになるにつれて、セーフガードを改善し、プライバシーコントロールをより明確にし、情報の使用方法を決定するための実用的な方法を人々に提供し続けます。

How ChatGPT learns about the world while protecting privacy | OpenAI News | DocsDigest