フロンティアAIに関する対話の拡大Anthropic News / 2026/05/19宗教伝統との対話開始倫理リマインダーを実験評価と調査を拡大予定alignmentethicssafetyevaluationhuman-centeredgovernance
ゴブリンはどこから来たのかOpenAI News / 2026/04/29報酬が語彙を強化Nerdyから挙動が転移報酬とデータを修正して鎮静化reinforcement-learningreward-modelingfine-tuningdata-filteringmodel-auditalignment
OpenAI Safety Fellowshipの発表OpenAI News / 2026/04/06期間: 2026/09/14-2027/02/05支援: 月次支給・計算資源・APIクレジット応募締切: 2026/05/03safetyalignmentresearchfellowshipmlbenchmarksprivacy
内部コーディングエージェントのミスアラインメントをどのように監視しているかOpenAI News / 2026/03/19GPT‑5.4で低遅延解析30分以内に分類・重大度付与中度約1,000件をエスカレーションmonitoringagentsgpt-5.4alignmentsecurityinternal-deployments