長文の研究レポート評価は浅い評価に頼りがち──ScholarQA-CS2で示したメタ評価の課題 | arXiv News