SAHOO:自己改善するAIの「目標ズレ」を監視し、慎重に改善を続ける枠組み | arXiv News