オンポリシー一貫性訓練(OPCT)で大規模言語モデルの安全性が向上、能力低下はほぼ回避 | arXiv News