概要

ChatGPTは、コーディング、調査、分析、複数ステップの作業やツールを横断する実務など、さまざまな領域でより高い能力を発揮するようになっています。こうした能力向上は、モデルが世界に関する幅広い知識を構築し、新しいタスクに適用できるようになるために、多様なデータで学習していることに起因します。

OpenAIは最先端モデルを開発するにあたり、モデルの訓練プロセスがプライバシーを尊重するよう努めています。個人に関するプライベートな情報を学習するのではなく、有用な一般的パターンを学習するための技術を開発しており、ユーザーが自分のデータを管理できるようにする各種のコントロールとポリシーも整備しています。本記事では、どのような情報がモデル訓練に使われ得るか、訓練過程で個人情報の処理を減らすための対策、そしてユーザーがChatGPTの会話をモデル改善に使うかどうかを制御する方法を説明します。

どの情報が学習に使われるか

モデル（ChatGPT）を開発するために、以下のような情報ソースの混合を利用します:

公に入手可能な情報
パートナーシップを通じてアクセスする情報
ユーザー、契約者、研究者が提供または生成した情報

これらのデータは、モデルが一般的な知識を構築し、より信頼性・安全性の高い応答を生成するのに役立ちます。公開されているインターネット上のコンテンツについては、自由にオープンにアクセス可能な情報のみを使用します。たとえば、公開フォーラムへの投稿やブログの公開記事など、外部から自由に参照できるコンテンツはモデル訓練に利用されることがあります。（opens in a new window）

学習データから個人情報を減らす方法

訓練に使う前に、データセット内の個人情報を減らすための各種保護措置を適用します。その一つが OpenAI Privacy Filter で、テキスト内の個人情報を検出してマスクします。評価では、Privacy Filterは同種のツールよりも個人情報の除去に高い効果を示しています。

Privacy Filterの社内版は、公開データセットだけでなく、ユーザーが「Improve the model for everyone」を有効にしている会話にも、訓練プロセスの複数段階で適用しています。また、Privacy Filterは業界全体でプライバシー保護を支援するために他の開発者にも無償で提供しています。（opens in a new window）

ChatGPTのプライバシー設定

ユーザーは、自分のChatGPTとの会話が将来のモデル訓練に使われるかどうかを選択できます。手順は次の通りです:

Settings → Data Controls に移動し、Improve the model for everyone（opens in a new window）をオフにする。

この設定をオフにすると、新しい会話はチャット履歴に表示されますが、ChatGPTの訓練には使用されません。

別のオプションとして Temporary Chat（opens in a new window）があります。開始方法:

新しいチャットを開き、画面右上の「Temporary」ボタンをクリックする。

Temporary Chat はチャット履歴に表示されず、メモリを作成せず、モデル改善にも使用されません。安全上の目的で会話は30日間保持され、その後削除されます。

さらに、Memory（opens in a new window）は、重要な人物、進行中のプロジェクト、頻繁に尋ねるトピックなど、繰り返しChatGPTに知らせたくない情報を記憶することで応答を有用にします。これは常に任意で、保存されたメモリは確認、編集、削除が可能です。メモリを完全にオフにすると、ChatGPTは過去の会話からメモリを保存も参照もしません。

ユーザーはまた、ChatGPTデータのエクスポート、アカウント削除、設定からのデータコントロール管理、およびプライバシーリクエストを privacy request portal（opens in a new window）を通じて送信することができます。ユーザーは、利用や参照されたくない機密情報をChatGPTに共有しないでください。

回答におけるプライバシーの保護

ChatGPTは個人に関する私的または機微な情報を求めるリクエストを拒否するよう設計されています。ただし、誤りを犯すことがあります（opens in a new window）。もしChatGPTの出力に誰かの個人情報が含まれ、それが不正確または不適切だと当該の人物が判断した場合は、privacy request portal（opens in a new window）を通じてリクエストを提出できます。

私たちが真剣に受け止めている責任

人々はより個人的な用途でChatGPTを利用しており、生活のセンシティブな側面に関わる質問やタスクにも使われています。その信頼に伴う重大な責任を私たちは認識しています。ChatGPTを利用する人々を大切に思っており、彼らのプライバシー保護はプロダクト設計の中心です。

また、プライバシー保護と重大な危害リスクへの対処は両立させる必要があります。私たちはこの責任を重く受け止めており、プライバシー保護を維持しながら、暴力等の信頼できる脅威を検出して対応する仕組みを強化し続けています。コミュニティの安全と執行に対する方針については、こちらで詳しく読むことができます。

フランス語版（元文は英語版に続きます）の要旨

以下は、英語本文と同内容のフランス語テキストに対応する日本語訳の要旨です。主なポイントは英語版と同じです:

訓練に使われる情報源: 公開情報、パートナー経由の情報、ユーザー・契約者・研究者が提供・生成した情報。
訓練前に個人情報を減らすための措置として OpenAI Privacy Filter を使用。
ユーザーは Settings → Data Controls で Improve the model for everyone をオフにできる。
Temporary Chat と Memory の機能とそれぞれの挙動（30日で削除される一時チャット、任意で管理可能なメモリ）。
回答で個人情報が含まれる場合の privacy request portal を通じた対応。
プライバシー保護と重大リスク対策の両立に関する責任の重さ。

（フランス語原文の内容は英語本文と実質的に一致しており、上記がその日本語による要約かつ翻訳です。）

How ChatGPT learns about the world while protecting privacy

Summary

Summary

Key Points

Actions for engineers

Key takeaway