ブロックチェーン上で暗号化されたまま遺伝的リスクを計算する仕組み:bioETH-PRSの概要
この論文は、個人の遺伝情報を外部に見せずにポリジェニックリスクスコア(PRS)を計算する新しいプロトコル「bioETH-PRS」を示します。研究者らは、計算の担当者(評価者)を信頼する必要をなくし、代わりに不変のスマートコントラクトと完全準同型暗号(Fully Homomorphic Encryption, FHE)を組み合わせて、患者の遺伝子情報と研究モデルの重みを実行中ずっと隠したまま内積計算を行えることを示しました。
具体的には、整数演算に正確なTFHEというFHE方式を、FHE対応の仮想実行環境(fhEVM)上で使います。PRSの計算は遺伝子の用量ベクトルとGWAS(ゲノムワイド関連解析)の重みベクトルの内積です。TFHEは符号付き小数を扱えないため、著者らは符号付きのGWAS重みを符号なし64ビット整数に変換する「三段階の固定小数点量子化」手法を作りました。検証用フィクスチャーでは機械イプシロン級の再構成精度(相関 r>0.999、平均二乗誤差 MSE<2.3×10^−6)を達成しています。
システムは四つのスマートコントラクトに分かれます。データ登録(患者データの所在とアクセス管理)、モデル公開(GWAS重みの格納と公開/非公開制御)、計算エンジン(暗号化された内積計算の実行)、出力オラクル(結果の公開とプライバシー保護)です。ブロックチェーン上には暗号文そのものは置かれず、32バイトのハンドルだけが記録されます。オフチェーンのfhEVMコプロセッサが実際の暗号文を管理します。公開モデルでは重みを平文整数で置けるため、暗号文×平文の掛け算は暗号文同士より約60%安価になると報告しています。
なぜ重要かというと、この設計は患者のゲノム(個人を特定し得る情報)と研究者のモデル重みの両方を保護しつつ、計算を証明可能で監査できる形にします。さらに出力は「暗号化されたノイジースコアのハンドル」と「公開で復号可能な三段階カテゴリ」を同時に出す仕組みを持ち、スコアを直接漏らさないようにしています。加えて、モデルごと・ウォレットごと・サンプルごとのレート制限を組み合わせることで、モデル重みの抽出(プロービング)を高コストにする対策も導入されています。プロトタイプ評価では100〜5,000個の変異点(SNP)でのオンチェーンFHE計算を試し、ガス(手数料)消費は線形に増えること、ストリーミング実行で模擬測定のガスが37%減ったことなどを報告しています。
重要な注意点もあります。今回の成果はプロトタイプと実験評価に基づくもので、測定したガス削減や可用性は使用するブロックチェーンやfhEVMコプロセッサの実装次第で変わります。fhEVMのトランザクション当たりの同時FHE演算予算(プロトタイプでは60–74回と測定)は制約となり、大規模なSNP数ではチャンク分割が必要です。TFHEを使うために重みの量子化が必須であり、今回の報告は最大5,000SNPでの実証が中心です。つまり、数万〜百万規模のゲノム全体スコアをそのままオンチェーンで実行するには、さらなる検証と最適化が必要です。