Anthropic共同創設者クリス・オラによる教皇レオ14世の回勅「Magnifica humanitas」に関する発言Anthropic News / 2026/05/25外部批判の必要性モデルの不可解な内部状態利益の公平な分配aisafetyinterpretabilitygovernanceethicspolicy
モデル仕様へのアプローチの内側OpenAI News / 2026/03/25行動規範を公開チェーン・オブ・コマンドルーブリックで解釈model-specchain-of-commandsafetydefaultsevaluationinterpretability