当社の選挙対策に関する最新情報

公開日: 2026-04-24

世界中の人々は、選挙期間中に政党や候補者、争点についての情報を得るため、またいつ・どこで・どのように投票するかといった単純な質問に答えるためにClaudeを利用します。私たちの見解では、AIモデルがこれらの質問に正確かつ中立に答えられるのであれば、それは民主的プロセスにとって前向きな力になり得ます。本稿では、今年の米国中間選挙やその他の主要選挙に向けてClaudeがその基準を満たすようにするために行っている取り組みについて説明します。

測定と政治的偏りの防止

Claudeに政治的な話題を尋ねたとき、包括的で正確かつバランスの取れた応答が返ってくるべきです。利用者が自ら結論を出せるように導き、特定の見解へ誘導しない応答を目指しています。そのため、私たちはClaudeを異なる政治的見解に対して同等の深さ・関与・分析力で扱うよう学習させています。これはClaude’s constitutionで示された原則です。

この方針は、キャラクタートレーニング（一定の価値観や特性を反映する応答をモデルに報奨する手法）でモデルに組み込み、さらにsystem promptsを通じて政治的中立性に関する明確な指示をClaude.ai上のすべての会話に持ち込み強化しています。（このプロセスの詳細は、以前の投稿でご覧いただけます。）

説明動画: Political bias in AI modelsに関する解説を公開しています。
ローンチ前には、幅広い政治スペクトルの見解を含むプロンプトに対して、どれだけ一貫して、思慮深く、公平に応答するかを評価します。たとえば、ある立場に長文を割き対立する立場には一文だけを与えるようなモデルは低評価となります。
直近の評価では、Opus 4.7 と Sonnet 4.6 がそれぞれ95% と 96% のスコアを記録しました。
評価手法とオープンソースのデータセットはこちらで公開しており、外部の再現や改善を歓迎しています。
第三者や業界専門家からのフィードバックも受け入れており、現在は The Future of Free Speech（Vanderbilt Universityの独立シンクタンク）、Foundation for American Innovation、Collective Intelligence Project と協力して表現の自由に関するモデル挙動の包括的レビューを進めています。

ポリシーの施行と防御のテスト

私たちのUsage Policyは、選挙に関連するClaudeの利用に関して明確な規則を定めています。Claudeは、欺瞞的な政治キャンペーンの実行、政治的発言に影響を与える偽のデジタルコンテンツの作成、有権者詐欺の実行、投票システムへの干渉、投票手続きに関する誤解を招く情報の拡散などに使うことはできません。

これらのポリシーは強力な検出と施行によって支えられています。自動分類器を用いて潜在的な違反の兆候を検出し、専任の脅威インテリジェンスチームが協調的な悪用活動を調査・阻止します。これらは常時稼働する第一線の防御を形成し、数百万件に及ぶ日常的な会話を妨げることなく、実際の悪用に対応できるようにしています。

選挙関連リスクへの耐性を測るために、候補者、投票、選挙運営に関する質問や悪用の試みへの応答を調べる一連のテストを実施しています。このアプローチについては2024年に初めて公表しました。

最新のテストは、実際に人々が選挙についてClaudeに尋ねる話し方に基づく600件のプロンプトを使用しています。内訳は危険な要求300件（選挙の誤情報を生成させようとする試みなど）と正当な要求300件（キャンペーン用コンテンツや市民参画リソースの作成など）です。
正当な要求に適切に応じ、危険な要求を拒否する能力を評価します。Claude Opus 4.7 と Claude Sonnet 4.6 はそれぞれ100% と 99.8% の適切な応答率を示しました。
またインフルエンス作戦（偽の人格、捏造されたコンテンツ、欺瞞的な増幅を通じて世論や政治的成果を操作する協調的な試み）にも耐えられるかを、悪意ある行為者が用いる段階的手法を模したマルチターンのシミュレーション会話で評価しています。直近の評価では Sonnet 4.6 と Opus 4.7 がそれぞれ90% と 94% の適切な応答率を示しました。
配備後は追加の監視とsystem promptを併用して、選挙関連の悪用リスクをさらに低減します。
Mythos Preview と Opus 4.7 のローンチ前検証では、モデルが自律的にインフルエンス作戦を計画・実行できるか（人間の指示なしにマルチステップのキャンペーンを端から端まで完遂できるか）を初めて試しました。セーフガードと学習がある状態では最新モデルはほとんどのタスクを拒否しましたが、セーフガードを外して生の能力を測った場合には Mythos Preview と Opus 4.7 が半数以上のタスクを完了しました。これらのモデルは依然として大きな人間の指示を要するものの、この結果は継続的な警戒の必要性を強調しています。

私たちはこれらの評価を継続的に実施・改善し、必要に応じて対策を実装していきます。

信頼できる選挙リソースの共有

Claudeに情報を求める人には事実を提示し、必要に応じて信頼できる最新の情報源を案内したいと考えています。その一手段が選挙バナーです。選挙バナーは2024年に初めて導入し、米国やその他主要選挙の前に展開しました。Claude.ai上で有権者登録、投票所、選挙日、投票用紙情報などを尋ねられた場合、Claudeは信頼できる情報源を指す選挙バナーを表示します。

今年の米国中間選挙では、バナーは TurboVote（Democracy Works による非党派のリアルタイム有権者情報リソース）へ利用者を案内します。今年後半にはブラジルの選挙向けに同様のバナーを実装予定で、将来的には他地域の選挙にもこの機能を拡大していく計画です。

Claudeの選挙バナーは、利用者を非党派の有権者リソースであるTurboVoteに誘導します。

今後の見通し

選挙期間中に利用者がClaudeを選んで情報を得る際、その情報が正確で信頼でき、バランスの取れたものであると信頼できるようにしたいと考えています。この目的を反映するように、私たちはセーフガード、ポリシー、モデル訓練プロセス、評価を構築してきました。

この選挙サイクルおよびその先にわたって、システムの監視、検出能力のテスト、実際の利用状況から得られる知見に基づくセーフガードの調整を継続して行っていきます。

An update on our election safeguards

Summary

Summary

Key Points

Engineering implications

Translations

当社の選挙対策に関する最新情報

測定と政治的偏りの防止

ポリシーの施行と防御のテスト

信頼できる選挙リソースの共有

最新情報の提供

今後の見通し