AVISE:言語モデルの「脱獄」脆弱性を自動で探すためのオープンな評価フレームワーク | arXiv News