エントロピック最適輸送で見つかった「閉集合」向け大偏差上界の失敗
要点:確率移送問題にエントロピー正則化を加えた「エントロピック最適輸送(静的シュレディンガー問題)」で、従来知られていたコンパクト集合に対する大偏差の上界は成り立つが、それを任意の閉集合まで拡張することは一般にできない、という具体的な反例を示した研究です。研究者らは正則化の強さを示すパラメータε→0の極限で、上界が破れる具体例と、閉集合へ拡張するための正確な「裾(テール)基準」を示しました。さらに、周辺分布(マージナル)の支持が非コンパクトだと、速度1/εでの完全な大偏差原理(LDP)は存在し得ないことを証明しています。LDPはLarge Deviation Principle(大偏差原理)の略です。
問題の設定:XとYは適当な測度空間で、与えられた周辺分布(一次、二次の分布)と連続コスト関数のもとで、各ε>0についてエントロピックな目的関数を最小化する確率計画P_εが一意に存在します。過去の結果(Bernton・Ghosal・Nutz, BGN)が示したのは、これらのP_εについてコンパクト集合に対する上界は成り立つということです。研究上の自然な疑問は、その上界が任意の閉集合にも当てはまるか、という点でした。
何をしたかと結果:研究者らは、一次分布が原子を持たない(非原子的)例と連続なコストを用いて、P_εが総変動距離である最適計画P*に収束し、その支持(サポート)は非コンパクトになるようなモデルを構成しました(定理1.1)。そのモデルでは、ある閉集合Fについて、BGNが与える候補のレート関数I_Γに対してinf_F I_Γが正であるにもかかわらず、ε log P_ε(F) のlimsupが−inf_F I_Γより大きくなり、閉集合に対する上界が破れます。さらに定理1.2では、こうした状況では速度1/εで任意の下半連続(lower semicontinuous)なレート関数による完全な大偏差原理は存在しないことが示されます。
構成のアイデア:反例はまず離散的な「ブロック」モデルから出発します。各ブロックには同じコストを持つ多数の状態があり、その多重性(数の多さ)が有効な指数を下げる仕組みがあります。つまり、単一の状態のコストbに対して、多数が居ることで実効的な指数がb−κに下がります。これを、各離散ラベルをコンパクト区間に置き換え、コストをラベルごとに定数にすることで非原子的な連続モデルへ引き上げます。得られる最適計画の支持は、無限に外へ逃げる矩形の可算和の形をとり、非コンパクトになります。
一般的な基準と根本的障害:論文では、閉集合Fについての裾指数β(F)を定義し(簡単には各コンパクトによる外側の質量のεスケールでの挙動を測る量)、コンパクト集合に対する上界とβ(F)を使えば、閉集合へ上界を拡張できるかどうかが判定できることを示します(命題2.3)。特にβ(F)が−inf_F Iより小さければ拡張可能です。しかし命題2.6では、片方の周辺分布の支持が非コンパクトだと、任意のコンパクトKについてε log Q_ε(K^c)のlimsupが0になり、いわゆる指数的タイトネス(exponential tightness)は成立しないとしています。これは今回の障害が固定マージナルかつ非コンパクト支持という設定に本質的に結び付いていることを示します。
なぜ重要かと限定事項:この研究は、エントロピック最適輸送で得られるコンパクト集合向けの大偏差上界が自動的に閉集合向けに拡張されるわけではないことを明確に示しました。実務的には、完全な大偏差原理や閉集合への上界を使いたい場合、追加のタイトネス条件や空間の幾何学的仮定(たとえば支持が連結であることやより強い拘束性)が必要であることを示唆します。一方で、本件は反例による否定的結果であり、論文自身も幾何学的または他の追加仮定があれば完全なLDPが回復する可能性を排除してはいません。研究は位相的な構成に重点を置いており、一般的な条件がどこまで緩くできるかは今後の課題として残ります。