Projekteja vuodessa
Abstrakti
The ability to plan actions on multiple levels of abstraction enables intelligent agents to solve complex tasks effectively. However, learning the models for both low and high-level planning from demonstrations has proven challenging, especially with higher-dimensional inputs. To address this issue, we propose to use reinforcement learning to identify subgoals in expert trajectories by associating the magnitude of the rewards with the predictability of low-level actions given the state and the chosen subgoal. We build a vector-quantized generative model for the identified subgoals to perform subgoal-level planning. In experiments, the algorithm excels at solving complex, long-horizon decision-making problems outperforming state-of-the-art. Because of its ability to plan, our algorithm can find better trajectories than the ones in the training set.
Alkuperäiskieli | Englanti |
---|---|
Otsikko | Proceedings of the 40th International Conference on Machine Learning |
Toimittajat | Andread Krause, Emma Brunskill, Kyunghyun Cho, Barbara Engelhardt, Sivan Sabato, Jonathan Scarlett |
Kustantaja | JMLR |
Sivut | 17896-17919 |
Sivumäärä | 24 |
Tila | Julkaistu - heinäk. 2023 |
OKM-julkaisutyyppi | A4 Artikkeli konferenssijulkaisussa |
Tapahtuma | International Conference on Machine Learning - Honolulu, Yhdysvallat Kesto: 23 heinäk. 2023 → 29 heinäk. 2023 Konferenssinumero: 40 |
Julkaisusarja
Nimi | Proceedings of Machine Learning Research |
---|---|
Kustantaja | PMLR |
Vuosikerta | 202 |
ISSN (elektroninen) | 2640-3498 |
Conference
Conference | International Conference on Machine Learning |
---|---|
Lyhennettä | ICML |
Maa/Alue | Yhdysvallat |
Kaupunki | Honolulu |
Ajanjakso | 23/07/2023 → 29/07/2023 |
Sormenjälki
Sukella tutkimusaiheisiin 'Hierarchical Imitation Learning with Vector Quantized Models'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.Projektit
- 2 Päättynyt
-
Safe: Turvallinen vahvistusoppiminen epästationaarisissa ympäristöissä nopealla sopeutumisella ja häiriöennustuksella
Pajarinen, J. (Vastuullinen tutkija)
01/01/2022 → 31/12/2024
Projekti: Academy of Finland: Other research funding
-
-: Finnish Center for Artificial Intelligence
Kaski, S. (Vastuullinen tutkija)
01/01/2019 → 31/12/2022
Projekti: Academy of Finland: Other research funding