大規模な拡散MRIでの「構造化された品質管理」を実践し問題点を明らかに
この論文は、拡散磁気共鳴画像法(dMRI: diffusion MRI)で得られる多様な数値や派生データの信頼性を守るために、広範な品質管理(QC: Quality Control)がどうあるべきかを調べた研究です。dMRI は脳の白質の微細構造や大きな構造を調べるために使われます。大規模な研究が増えると、検査すべき出力も増え、見落としが生じやすくなります。研究グループは、単なる集計値だけでは見つからない問題が、構造化された視覚的点検で明らかになることを踏まえて、本格的に調べました。
研究者たちは、9つのデータセットに含まれる合計18,328件のdMRIスキャンについて、7種類の処理パイプラインの出力を対象に「構造化されたQCフレームワーク」を展開しました。ここで言う処理パイプラインとは、元の撮像データから解析結果を出すまでの一連の処理手順のことです。評価は人が目で見て行う視覚的な検査に基づき、各パイプラインが出す複数の中間・最終出力を系統的にチェックしました。
主な発見の一つは、最終的な解析結果(下流の出力)が見た目では合格に見えても、その背後にある前段階(上流)の処理が失敗している場合がある、ということです。こうした上流の失敗は、パイプライン全体の階層を系統的に見て初めて発見できる場合があります。つまり、最終出力だけを見ていれば問題を見落とす可能性があるということです。
もう一つの重要な発見は、品質管理の「粒度」は使うアルゴリズムごとに異なる必要があるという点です。アルゴリズムの出力が示す空間的な構造によって、問題が部分的に起きているだけで済む場合と、データ全体を除外する必要がある場合とが分かれます。したがって、どこまで細かく除外や修正を行うかは、個々の処理結果の性質に応じて決めるべきだと示されました。
この研究は、大規模な視覚的QCを組織的に行うことが現実的で、解析上の価値があることを示しています。また、定量的な結果の妥当性と解釈可能性を守るには、処理の全階層にわたる体系的なQCが必要だという結論を示しています。一方で、要旨に示された情報では、どのパイプラインでどれくらいの頻度でどんな失敗が起きたかという具体的な数値や、個々のデータセットやアルゴリズム名までは示されていません。したがって、これらの知見を他の設定にどの程度そのまま当てはめられるかは、さらなる詳細な報告や追試が必要です。