合成ベンチマークで比べた中央計画と分散市場:計算プランナーが損失を小さくしたが、結果は方法論的検証にとどまる
この論文は、同じ人工経済環境で「計算プランナー」「エージェントベースの市場」「メタ市場(仲介的改良を加えた市場)」を再現可能なベンチマークで比較した研究です。報告された主要な結果は、訓練データとホールドアウト(検証)データ、さらにいくつかの敵対的ストレステストの下で、計算プランナーが一貫して平均的な福祉損失を低く抑えた、というものです。ただし著者自身は、この成果を「計画経済の決定的優位」として主張してはいません。主な貢献は、比較実験を正しく行える方法論の提示にあります。
研究チームは、入力─出力(インプット・アウトプット)と呼ばれる産業間の関係を組み込んだ合成の「世界」を作りました。各世界は150の産業、10の地域、7つの社会的ニーズ群、140の企業をもちます。モデルには需要観測のノイズ、能力制約、企業の異質性、価格の自律調整、構造ショック、情報報告実験、そして敵役(レッドチーム)による最適化探索が入っています。評価は11の損失項目(必須需要の未充足、総未充足、格差、品質不足、汚職、権利侵害、物流失敗、技術・革新の不足、環境負担、変動性、管理コスト)で行われ、重みはランダム化されます。
仕組みの違いは次の通りです。プランナーはノイズを含む需要信号と局所情報を受け取り、入力─出力の会計方程式(レオンティーフ方程式)を解いて生産計画を作成します。計画には能力や予備ルールを課し、必須産業を優先します。市場モデルは企業を産業に割り当て、需要超過に応じて価格を繰り返し調整し、10期間で生産や品質、現金流、評判を更新します。メタ市場はさらに強いアービトラージ(裁定)やヘッジの仕組みを加えたものです。実験では訓練10世界での平均損失はプランナー0.1018、市場0.3072、メタ市場0.2679であり、ホールドアウト5世界でもプランナー0.1100に対して市場0.3127、メタ市場0.2697でした。敵対的探索でも順位は覆らず、燃料・物流のストレスケースでは必須需要の未充足がプランナー0.0767、市場0.7806、メタ市場0.6721という大きな差が出ました。さらに再現実験と追加の100世界診断でもプランナーの優位性は保存され、数値的な安定性(スペクトル半径約0.55、残差は機械精度近傍)も確認されました。
しかし重要な注意点が多く示されています。著者は結果が方法論的検証としての意味合いにとどまることを強調します。設計上、プランナーに有利に働く選択がいくつかあります。たとえばプランナーは入力─出力行列や能力、必須産業ラベルなどを直接使いますが、市場側の企業は同じ技術情報を用いません。代表的な世界では40.7%の産業に企業が割り当てられておらず、プランナーについては権利侵害のフラグが常にゼロに固定されています。いくつかの監査フラグは「主張された」もので、実際に検証されたわけではありません。名目上のホールドアウトも訓練データ族を再利用している点や、報告されるインセンティブ試験が形式的なGroves(グローブス)メカニズムではない点など、外的妥当性を制限する要素が列挙されています。
結論として、この研究は「計算的に再現できる比較制度ベンチマーク」の原型を示した点で価値があります。議論を理想論と歴史的事例の対立に留めず、同一環境下で情報セットや評価指標をあらかじめ定めて検証可能にしたことが進歩です。一方で、これだけで現実世界での計画の優越を立証するわけではありません。著者は今後の検証課題として、実証校正(empirical calibration)、構造的ホールドアウト、感度分析、不確実性の定量化、真のメカニズム設計テスト、独立したレッドチーム再現などを挙げています。これらが進めば、同様のベンチマークが制度比較のより堅牢な実験室となる可能性があります。