rl の記事一覧 | DocsDigest

一致した記事数: 1

推論モデルは思考の連鎖を制御するのが苦手だが、それは良いことだ

OpenAI News / 2026/03/05

CoT制御率は極めて低い
長い推論や追加訓練で制御性低下
現状はCoT監視が有効な防護層

chain-of-thought cot monitoring evaluation safety rl prompting

前へ1 / 1次へ