「Unfireable Safety Kernel」— 実行時にAIの自己改変や回避を防ぐ安全境界の実装 | arXiv News