どのとき合わせるべきか、予測するべきか:マルチモーダル学習の「相図」を示す新しい枠組み | arXiv News