最適解は早く見つかる。証明に時間がかかる混合整数最適化を早期終了で短縮する方法
この論文は、混合整数最適化(連続変数と整数変数を含む最適化問題)を解くソルバーを、証明が終わる前に安全に早期終了させる方法を提案します。著者らはソルバーの内部状態から「真の最適性ギャップ」(現在の解と本当の最適値の差)をニューラルネットワークで予測し、コンフォーマル予測(conformal prediction、分布に依存しない不確実性の校正手法)で終了の閾値を調整します。結果として、distributional MIPLIBライブラリの5つの問題群で平均して解く時間を60%以上削減しつつ、解が最適値の0.1%以内であることを95%の確率で保証できたと報告しています。
混合整数問題は、枝刈り探索(branch-and-bound)などの手法で解かれます。これらの手法は時間経過とともに「上界」と「下界」を持ちます。上界は見つかった実行可能な解の値で、下界は最良値より小さいはずの目安です。両者が一致すると証明完了で最適と確定します。論文に示された例では、最適解自体は探索の序盤(約57秒)に見つかるのに、下界を十分に証明するのにさらに時間がかかり、ソルバーが正式に終了するのは約120秒になっていました。著者らの学習済み下界を使うと、この差のある時点で安全に終了できるようになります。
手法の中身は二段構成です。まず長短期記憶(LSTM: long short-term memory)を含むニューラルネットワークで、ソルバーの時点ごとの状態から真のサブオプティマリティ(最適性ギャップ)を予測します。次にコンフォーマル予測を使って、その予測に基づく「終了してよい」という閾値を校正します。コンフォーマル予測は、限られたデータでも確率的な保証を与える枠組みです。著者らはこの組み合わせにより、実際の問題分布に対して「所定の許容誤差内である確率」が理論的に保証される停止基準を得ています。論文では「本手法は既存の学習を使った加速手法とは違い、探索の決定ルールを改良するのではなく、いつ止めるかを学習する点が新しい」と述べています。
なぜ重要かというと、混合整数最適化はロボティクスや輸送、電力系の計画など多くの応用で使われますが、問題が大きくなると解証明に長い時間がかかります。実時間での意思決定が必要な場面では、最適に近い解をもっと早く返す手法が価値を持ちます。本手法は同じ種類の問題を繰り返し解く状況、つまり「問題分布」が存在する場面で特に有効です。
重要な注意点もあります。報告された性能と保証は、似たインスタンスの分布に基づいて学習・較正した場合のものです。ソルバー状態を一意に特定できるという前提は、同じハードウェア上で解くことを想定した近似に依存します。保証は確率的(例えば0.1%の誤差以内で95%の確率)であり、万能の厳密証明ではありません。実験はdistributional MIPLIBの5問題群で示されていますが、他の種類の問題や異なる環境での一般化については追加検証が必要です。