GoSafeOpt: Scalable Safe Exploration for Global Optimization of Dynamical Systems

Bhavya Sukhija, Matteo Turchetta, David Lindner, Andreas Krause, Sebastian Trimpe, Dominik Baumann

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

5 Sitaatiot (Scopus)
57 Lataukset (Pure)

Abstrakti

Learning optimal control policies directly on physical systems is challenging. Even a single failure can lead to costly hardware damage. Most existing model-free learning methods that guarantee safety, i.e., no failures, during exploration are limited to local optima. This work proposes GOSAFEOPT as the first provably safe and optimal algorithm that can safely discover globally optimal policies for systems with high-dimensional state space. We demonstrate the superiority of GOSAFEOPT over competing model-free safe learning methods in simulation and hardware experiments on a robot arm.

AlkuperäiskieliEnglanti
Artikkeli103922
Sivumäärä25
JulkaisuArtificial Intelligence
Vuosikerta320
Varhainen verkossa julkaisun päivämäärä20 huhtik. 2023
DOI - pysyväislinkit
TilaJulkaistu - heinäk. 2023
OKM-julkaisutyyppiA1 Alkuperäisartikkeli tieteellisessä aikakauslehdessä

Sormenjälki

Sukella tutkimusaiheisiin 'GoSafeOpt: Scalable Safe Exploration for Global Optimization of Dynamical Systems'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä