推論モデルは思考の連鎖を制御するのが苦手だが、それは良いことだOpenAI News / 2026/03/05CoT制御率は極めて低い長い推論や追加訓練で制御性低下現状はCoT監視が有効な防護層chain-of-thoughtcotmonitoringevaluationsafetyrlprompting
蒸留攻撃(distillation attacks)の検出と防止Anthropic News / 2026/02/233社による大規模抽出チェーン・オブ・ソート誘導の悪用検出・共有・アクセス制御で対抗distillationfraudulent-accountsbehavioral-detectionchain-of-thoughtapi-securityintelligence-sharing