空間分解トランスクリプトミクスでの「細胞分割」は未解決の重要課題
この論文は、空間分解トランスクリプトミクス(SRT:組織の中で遺伝子発現を位置付きで測る技術)における「細胞分割(セグメンテーション)」が、まだ解決されていない主要な問題だと論じています。細胞分割とは、画像や測定データから個々の細胞の領域を決めて、そこにある転写産物(RNA)の検出点を正しい細胞に割り当てる作業です。ここがうまくいかないと、その後の解析結果が誤った結論につながる恐れがあります。
著者らは現在の手法を整理し、問題点をまとめた総説を示しました。従来は画像の形(細胞膜や核の染色)に基づく分割が主でしたが、SRTでは転写産物の「点データ」も重要な手掛かりになります。最近は、これらを同時に最適化する「トランスクリプト情報を使った分割(transcript-informed segmentation)」という考え方も登場しています。研究で例示された技術には、イメージング系のXeniumやMERSCOPE、CosMx、配列系のStereo-seqやVisium HD、Open‑STなどがありますが、どの方法が普遍的に優れているかはまだ分かっていません。
分割が難しい理由は複数あります。検出される転写物はまばらで点状です。一方、免疫染色など形態を示す信号は連続した強度として現れます。さらに、転写物は拡散や光学的誤差で位置がずれる場合があります。組織を薄い断面として2次元に写すことで、本来の三次元構造が投影されることも混乱を招きます。加えて、普遍的に使える膜マーカーがないことや、切片で細胞が途中で切れること、周囲の「アンビエントRNA(周りに漂うRNA)」といった非細胞由来の信号も混入します。これらは「スピルオーバー(こぼれ)」や「空間的な出血」と呼ばれる現象を生み、ある転写物が本来の細胞とは別の場所に割り当てられてしまう原因になります。
正確な分割は結果に直結します。分割の誤りは細胞ごとの発現プロファイルを混ぜてしまい、細胞型の誤分類や細胞間相互作用の誤推定を引き起こします。SRTデータを既存の単一細胞解析(scRNA‑seq)と結び付ける際や、組織マップを作る際にも影響が出ます。著者らは、セグメンテーションを単なる前処理ではなく研究上の中心課題として扱うべきだと主張しています。
その上で、論文はコミュニティ主導の解決策を提案します。具体的には、セグメンテーション専用の評価指標(メトリクス)と金標準(ゴールドスタンダード)データセットを整備すること、スケーラブルなベンチマークや透明な報告基準を確立することが必要だと言います。最近は染色法の改良や人工知能(AI)を使った画像分割の進展があるものの、基盤的な限界はまだ残っていると指摘しています。
重要な注意点として、この論文は総説であり、特定の新しいアルゴリズムの性能比較や万能な解決策を示すものではありません。著者らも、現状では複数の手法が特定の条件で有効に見える一方で、どれが広く使えるかは不明であると慎重に述べています。SRTデータは収集が高価で増加中です。今後は共有された評価枠組みと標準データがなければ、手法の信頼性や再現性を高められないという点が強調されています。