Decision Transformerと二段階安全スタックで実現する自律送電系統周波数制御
この論文は、過去の運用記録だけを使って学習した「Decision Transformer(決定トランスフォーマー)」というモデルを用い、二段階の安全検査を組み合わせた自律的な送電系統の二次周波数制御を提案します。重要な点は、学習が完全にオフラインで行われ、運用時に危険な試行錯誤をしない点です。提案手法はシミュレーションで既存の自動発電制御(AGC)より大幅に良好な性能を示しましたが、実運用には追加の検証が必要です。
研究者たちは、まず既存の監視・制御データ(SCADAレコード)からDecision Transformerを学習させました。Decision Transformerは時系列データを使う「シーケンスモデル」です。目標となる性能指標(将来の達成目標)を条件に与えることで、過去の部分的に良い軌跡をつなぎ合わせ、より良い制御提案を生成できます。重要な利点は、強化学習に伴うオンラインでのランダムな試行(探索)を避けられることです。
学習済みモデルの出力はそのまま実際に反映するわけではありません。論文では「二段階安全スタック」を実装しました。第1段はConstraint Verification Unitで、送電網の線ごとの伝送寄与(PTDF=Power Transfer Distribution Factor)を使った代数的なチェックをサブ10ミリ秒で実行します。第2段は集約したデジタルツインで、発電機の揺動方程式(スイング方程式)に基づく動的安定性の検証を行います。安全スタックが制御提案を却下した場合は、チューニング済みAGCにフォールバックして運転を続けます。これにより最悪の場合でも業界基準レベルの性能が保たれる設計です。
評価は、現実に近いとされるNortheast Power Coordinating Council(NPCC)140バス系統の低慣性条件で行われました。シミュレーション結果では、提案コントローラーがチューニング済みAGCに対しエリア制御誤差(ACE)積分を99%以上削減しました。周波数の最小値(ナディア)は59.4Hzで、推論レイテンシ(制御提案の計算時間)は約10ミリ秒と報告されています。さらに、小信号固有値解析で支配的な電気機械モードが約1.87Hzであることを示し、安全スタックが複数の運転点で安定性を維持することを確認しています。比較対象として線形二次レギュレータ(LQR)や保守的なCQL(Conservative Q-Learning)と構造的に比較し、シーケンスモデルの利点を示しています。
重要な注意点があります。本研究は高精度な数値シミュレーションに基づく検証です。Decision Transformerはオフライン学習により探索リスクを避けますが、その性能は学習に使った履歴データの範囲と質に依存します。未知の状況やデータ分布の外側(アウト・オブ・ディストリビューション)では、モデルが不適切な提案を出す可能性があり、そこを安全スタックで遮断する設計です。現場導入には実機試験、運用者の承認、さらにモデルと安全検査の連携に関する実証が必要です。