reinforcement-learning Articles | DocsDigest

Matched posts: 2

Where the goblins came from

OpenAI News / Apr 29, 2026

報酬が語彙を強化
Nerdyから挙動が転移
報酬とデータを修正して鎮静化

reinforcement-learning reward-modeling fine-tuning data-filtering model-audit alignment

Improving instruction hierarchy in frontier LLMs

OpenAI News / Mar 10, 2026

IH‑Challenge dataset teaches instruction priority
Improves safety steerability and prompt‑injection robustness
Maintains usefulness without overrefusal

instruction-hierarchy reinforcement-learning prompt-injection safety dataset evaluation overrefusal

Previous1 / 1Next