「確率が高い答えは正しいのか?」 大規模言語モデルの生成確率と正答率の関係を調べた研究 | arXiv News