不確かさを考慮して「誰が治療で利益を得るか」を選ぶ方法:RCTで較正するコンフォーマル選別フレームワーク
この論文は、個々の患者がある治療から利益を得るかを、不確かさを刻んで判断する手法を提案します。研究者は、ランダム化比較試験(RCT:治療の効果を確かめる標準的な試験)からの較正(キャリブレーション)を用いて、患者一人ひとりについて「実際に治療利益が臨床的に意味のある閾値を超えるか」を検定する枠組みを提示しました。多くの患者を同時に選ぶときに生じる誤選択を統計的に管理する点が特徴です。
具体的には、研究者は「条件付き平均治療効果(CATE)」という考え方を出発点にしています。CATEは、ある患者の特徴(年齢や検査値など)をもとに、その患者が治療を受けた場合と受けなかった場合の期待される結果の差を表します。提案法では、各候補患者についてこの差が所定の閾値(多くの場合はゼロ、つまり「利益があるか」)を超えるかを検定し、コンフォーマル推論(conformal inference:データの分布にあまり仮定を置かずに不確かさを評価する方法)を使ってp値を作ります。出来上がったp値にはベンジャミニ─ホックバーグ(BH)手続きという方法で調整を行い、選ばれた患者群における偽発見率(FDR:誤って「利益あり」と判断する割合)を制御します。
現実問題としてRCTだけでは患者レベルの効果モデルを学ぶにはデータが少ないことが多い点にも対応しています。外部データ、たとえば実世界データ(RWD:診療記録や保険データなど)を使って柔軟な効果モデルを学習することができます。ただし外部データが試験対象集団と完全に同じとは限らないため、外部データはあくまでモデルの学習にのみ使い、最終的な較正やp値の算出はRCTデータに基づいて行うように設計しています。提案法はモデルに依存しない(モデル非依存)ため、従来の機械学習法や新しい表形式の基礎モデル(例:TabPFNやTabICL)と組み合わせて使えます。
なぜ重要かというと、臨床ではしばしば推定した効果の点推定値で患者を順位付けしたり閾値で選んだりしますが、そうした単純な方法は不確かさを無視し、多数の候補を同時に扱うと誤選択が増えがちです。本法は個々の患者について「利益がある」と言うための統計的な根拠を示します。論文はシミュレーションでこの方法が偽発見率を保つことを示しており、実データの事例として早期非小細胞肺がん(NSCLC:non-small-cell lung cancer)の症例で、より小さな切除が過剰治療を減らせる候補プロファイルを同定する使い方を示しています。
重要な注意点もあります。コンフォーマル推論の有限標本の正当性には「交換可能性」という条件(簡単に言えば、較正に使うデータと評価対象が同じ性質を持つこと)が関わります。外部データがターゲットの試験集団と異なる場合、その比較不良さは検出力(真に利益のある患者を見つける力)に影響します。論文でも、シミュレーションで検出力はベースとなる学習器や外部データの可比性に依存するとしています。また本法は「固定された候補群を検査する」設定を想定しており、長期間にわたる適用や別の意思決め文脈へのそのままの適用には注意が必要です。