霊長類の視覚処理は「一回通りの流れ」ではない:初期の脳活動は時間の流れで情報を運ぶ
この論文は、霊長類の視覚処理における「最初の一回のフィードフォワード(順方向)通過」が単純な段階的処理だという見方に疑問を投げかけます。研究者たちは、初期の処理でも脳活動の時間的な動き自体が物のカテゴリ情報を運んでいることを示しました。つまり、ある瞬間の空間的な活動パターンだけを見るだけでは重要な情報を見落とす可能性があります。
研究チームは、マカクザルの脳の後頭側溝に沿った複数の電極アレイから局所場電位(LFP)を同時記録しました。使ったのは16個(別個体では15個)の64チャネル“Utah”アレイで、V1に8個(7個)、V4に3個(4個)、IT(下側側頭皮質)に5個(4個)を配置しました。サルはTHINGSデータセットから選んだ1000枚の自然画像(100カテゴリ)を受動的に見ている間にデータを取り、解析にはノイズ対信号比が高いLFPを主に使いました。
解析ではまず各領域の反応遅延が段階的に増すことを確認しました。ITでのカテゴリ判別はおおむね刺激後約150msでピークに達します。しかし注目すべきは、V4の活動がITの活動を予測する時間点が一つではなく二つに分かれていたことです。一つはV4の46msの活動がITの約74msを予測する「早期」成分、もう一つはV4の約80msがITの約120msを予測する「後期」成分です。これらは、従来「最初のフィードフォワード」の間に一度だけ起きると考えられてきた時間窓内で観察されました。
早期と後期で伝わる情報の中身も異なりました。研究者たちは線形モデルでV4からITへの予測重み行列を比較し、さらに表現類似性分析(RSA:多数の刺激に対する信号パターンの違いを比べる手法)を行いました。早期と後期で表現の幾何(刺激間の関係)は有意に異なり(片側パーミュテーション検定、p=0.0)、ITの表現は時間とともに早期と後期がそれぞれ異なる分散を説明しました(早期56–96msでp=0.005、後期106–152msでp=0.012)。さらに、畳み込みニューラルネットワーク(ResNet18)の層と比較すると、早期の予測は低レベルの特徴に、後期の予測はより抽象的なカテゴリ情報に整合する傾向がありました。加えて、時系列をまたいで情報を読み取るリカレントニューラルネットワーク(RNN)型のデコーダーは、単一時点の空間パターンよりも時間的な動きがカテゴリ情報を大きく高めることを示しました。
この結果が示すのは、視覚の初期段階でさえ情報は単に順に渡されるだけでなく、時間的に変化するダイナミクスの中に重要な符号化があるということです。したがって、研究者がしばしば行う「短い時間窓で平均してしまう」解析や「その時点だけで判定する」方法は情報を見落とすおそれがあります。視覚系を動的なシステムとして扱うことの重要性が強調されます。
留意点としては、解析は主にLFP信号に基づいている点です。LFPは信号対雑音比が高い利点がありますが、単一ニューロンの発火(スパイク)とは性質が異なるため、結果がすべての神経信号指標にそのまま当てはまるかは注意が必要です。また、結果は別個体のサルでも補足資料で再現されたと報告されていますが、本研究は特定の記録配置・刺激セット・解析手法(線形モデル、RSA、ANN比較、RNNデコーダー)に依存しています。これらの点は、今後の検証や異なる手法との比較でさらに確認される必要があります。