確率密度で因果を読む新手法――ドイツ東西の賃金格差を分布の形で調べる
研究の主な考えはこうです。従来は平均の差だけを見て因果効果を議論することが多いです。今回の論文は、結果の「分布全体」、つまり確率密度を使って因果を推定する枠組みを提案します。平均では見えない、分布の形やゼロに集まる確率などの違いを直接調べられるようにした点が新しいです。
著者は「反実仮想(カウンターファクト)密度」と呼ぶ考えを定義しました。具体的には二つの効果に分けて差を説明します。第一に「分布効果」は、ある集団の条件付き分布(ある特徴を持った人たちにおける賃金の分布)を別の集団の条件付き分布に変えたときの影響です。第二に「共変量効果」は、年齢や学歴といった説明変数の分布を仮に変えたときの影響です。この分解は伝統的なOaxaca–Blinder分解に似ていますが、ここでは割合的な差(比)に着目しています。
方法面では、推定のために「ベイズ・ヒルベルト空間」と呼ばれる数学的な扱いを使います。これは確率密度の非負性と総和が1になる性質を保ちながら計算するための道具です。実際の推定は柔軟な加法モデルを使い、スプラインなどの基底関数で表現して近似的にポアソン回帰の形で解く仕組みです。こうすることで、完全な非パラメトリック推定が直面する「次元の呪い」や、単純なパラメトリックモデルの当てはまり誤りを回避しやすくなります。また、分位点回帰で必要な「分位の交差回避」などの面倒も不要で、ゼロが多い(ゼロインフレ)や混合型の結果変数にも対応できます。
この手法を使ってドイツの東西賃金格差を分析しました。筆者らの主要な発見は次の通りです。再統一後の30年間で東西格差は縮小したが、なお差が残ること。残る差は主に「条件付き分布の違い」、つまり同じ特徴を持つ人たちの賃金の分布の差によって説明され、説明変数の構成(年齢や学歴の違い)が占める割合は小さいこと。さらに、差は男性集団でより顕著であり、東西賃金格差は大部分が男性に関わる問題であることが示唆されました。手法はゼロに集まる確率(失業など)や分布の二峰性も捉えられる点が強みです。
重要な注意点もあります。論文が因果と呼ぶためには「非交絡(隠れ要因がない)」と「重なり(両群で同じような説明変数の範囲がある)」という古典的な仮定が必要です。つまり観測できない重要な差が残っていると因果解釈は弱くなります。また、反実仮想密度の推定は条件付き密度の正確な推定に依存します。著者らは有限標本での性質を調べるシミュレーションも行っていますが、実際の応用ではモデル仕様や基底関数の選び方などが結果に影響する点に注意が必要です。