GPUで高速に評価できる「線形化誤差境界」を使って実時間で保証付きの頑健最適制御を行う方法を提案
この論文は、不確かさのある非線形システムやニューラルネットワークで表現される力学に対して、実時間で動作し、かつ制約を満たすことを保証する最適制御を目指しています。研究の中心にあるのは「線形化誤差境界(LEB: linearization error bound)」と呼ばれる考え方です。非線形系を線形時変(LTV: linear time-varying)近似で扱うと計算は楽になりますが、近似誤差を確実に上限評価しないと制約違反が起きる恐れがあります。ここでは、その誤差を厳密にかつ微分可能に評価する手法を作り、GPUで並列実行できるようにしています。
研究者たちは、解析的に記述できる力学系とニューラルネットワーク(NN)で表現される力学系の両方に対して、緩めすぎない(tight)LEBを設計しました。解析系には経路に沿ったヘッセ行列(2階微分行列)の上界を使う新しい方法を導入し、従来の区間法よりも狭い境界を得ます。NN力学については、NN検証ツールで得たアフィン緩和(直線近似の上界)に局所的なヤコビアン(一次微分)補正を加えて誤差を証明つきで評価します。これらの評価はJAXで実装してGPU並列化し、SLS(System-Level Synthesis)と呼ばれるLTVベースのロバスト制御器合成法に組み込みました。組み込みにあたっては、右逆行列(right-invertible)を持つ摂動行列や、中心がゼロでない摂動集合を扱えるように拡張し、ゾノトープと呼ばれる形で不確かさを伝搬させます。手法の名はGPUSLS-LEOです。
仕組みを大まかに説明すると、まず動作の基準となる「標準軌道(nominal trajectory)」をとり、その周りで力学を一次近似(LTV)します。実際の非線形部分はテイラー剰余や摂動行列の変化として残りますが、それをLEBとして区間やゾノトープで上から包みます。SLS側はこの上界を使って、摂動に応答するフィードバック政策を同時に最適化します。結果として、実際に可能な軌道の集合(到達チューブ)が厳密に過剰評価され、それに基づく制約緩和で実システムでも安全性が保たれることをめざします。
なぜ重要かというと、従来は正確な到達可能性解析が計算的に難しく、特に状態次元が10を超えると実時間解析はほぼ不可能でした。GPUSLS-LEOはGPUで並列化することで、168次元までの複雑な非線形やNN力学に対してオンラインで誤差評価とロバスト最適制御が可能になったと報告しています。実験では最大で毎秒67回(67Hz)で制御方策を計算でき、最短のソルブ時間は約15ミリ秒、扱った問題はおよそ2×10^5の意思決定変数を含む規模だったと示されています。これらは「形式的な保証」を維持しながら現実時間で動作する点で実用的な前進です。
ただし重要な注意点もあります。本法はあくまで非線形系を線形時変近似で扱う手法であり、完全な(正確な)到達可能性解析ではなく、常に過大(保守的)な上界による近似を用いています。元論文でも、線形化自由の直接的解析は一般に実時間には不可能であるためLTV近似を使う旨が述べられており、LEBの品質は区間算術やNN検証ツールの性能に依存します。さらに、ここに示した結果は論文本体での評価に基づく報告であり、ベンチマークや実機環境によって性能や保守性(conservativeness)が変わる可能性があります。全文では実験の詳細や追加条件が示されているはずなので、適用の際は元論文の具体的な評価セクションを参照する必要があります。