ゴブリンはどこから来たのかOpenAI News / 2026/04/29報酬が語彙を強化Nerdyから挙動が転移報酬とデータを修正して鎮静化reinforcement-learningreward-modelingfine-tuningdata-filteringmodel-auditalignment
OpenAI Privacy Filter の紹介OpenAI News / 2026/04/22ローカル実行可長コンテキスト対応(128k)修正版ベンチでF1≈97.4%piiredactiontoken-classificationspan-decodinglocal-deploymentprivacyfine-tuning