線形近似とオンラインGaussian Processで非線形システムの安全な探索を実現
この論文は、完全なモデルがない非線形プロセスを運転しながら、安全性を保って未知の振る舞いを学習する方法を示します。研究者たちは、プロセスの「おおまかな線形近似」が分かっているだけという現実的な状況を想定しました。未知の非線形部分はオンラインで学習するGaussian process(ガウス過程、入力に対する予測平均と不確かさを出す統計モデル)で表します。安全性は「高い確率で成り立つ制御不変集合(probabilistic control‑invariant set, PCIS)」として定義し、Lyapunov(リアプノフ)理論を使って保証します。リアプノフ関数とは、値が減少すれば系が安定すると示すための関数です。
具体的には、既知の線形モデルに対して線形安定化フィードバック(u_lin=−Kx)と対応する二次Lyapunov関数V(x)=x^T P xを用意します。未知の残差をガウス過程gでモデル化し、時点tでの予測平均µ_t(x)と標準偏差σ_t(x)を得ます。安全性の条件は、最悪のガウス過程誤差を考慮して∇V·(Ax+Bu+µ_t(x)) + β_t σ_t(x) ∥∇V∥ + λ V(x) ≤ 0となるような状態集合を定義するものです。この集合内に初期状態があれば、その後の軌道は確率1−δ以上で集合内に留まると主張します(δは許容するリスク率)。
制御入力は毎時刻、二次計画問題(凸なQuadratic Program, QP)で求めます。目的は既知の安定化入力から離れすぎずに、ガウス過程の不確かさを減らすような情報獲得を最大化することです。同時にPCISで定めた確率的安全制約を満たします。著者らは多段先読みで不確かさが増幅される手法(例:長期のSafe MPC)より保守的になりにくいように、1ステップのLyapunov減少条件とガウス過程の信頼区間を使ってQPを凸に保つ設計にしています。
論文は有限データでの確率的保証も扱います。ガウス過程用の信頼尺度β_tはGP‑UCBに基づく有限サンプルのスケジュールを採用し、実務的には検証用データで経験的なキャリブレーションを行ってγ⋆という補正を掛けたσ̃=√γ⋆ σを使います。また、ガウス過程の学習はデータ量に対して計算負荷が増す(学習はO(n^3)、予測はO(n^2))ため、オンライン運用では疎化・誘導点(inducing point)近似などが必要だと述べています。数値実験では、安全集合が約30%拡大し、ガウス過程の検証上のルート平均二乗誤差(RMSE)が1.11から0.03に低下するなど、学習しつつ安全性を保てる可能性を示しています。
重要な注意点もあります。本手法の保証は確率的(高確率)であり、絶対的な安全を約束するものではありません。前提として「安定化可能な線形近似」とそのための線形フィードバックとLyapunov関数が用意できることが必要です。ガウス過程の性能はカーネル選択やβ_tの設定に依存し、それらは保守的に上界を取ることが多い点も実務上の制約です。さらに、ガウス過程の計算コストの問題や、経験的キャリブレーションが必要なことも実装上の課題として挙げられています。以上を踏まえれば、本研究は部分的にしか分かっていない動的系を現場で安全に学習するための実用的な枠組みを提示するものです。