Turvallinen vahvistusoppiminen epästationaarisissa ympäristöissä nopealla sopeutumisella ja häiriöennustuksella

Projektin yksityiskohdat

AkronyymiSafe
TilaKäynnissä
Todellinen alku/loppupvm01/01/202231/12/2024

Yhteistyöpartnerit

Sormenjälki

Tutustu tutkimuksen aiheisiin, joita tämä projekti koskee. Nämä merkinnät luodaan taustalla olevien stipendien/apurahojen perusteella. Yhdessä ne muodostavat ainutlaatuisen sormenjäljen.
  • Hierarchical Imitation Learning with Vector Quantized Models

    Kujanpää, K., Pajarinen, J. & Ilin, A., heinäk. 2023, Proceedings of the 40th International Conference on Machine Learning. Krause, A., Brunskill, E., Cho, K., Engelhardt, B., Sabato, S. & Scarlett, J. (toim.). JMLR, s. 17896-17919 24 Sivumäärä (Proceedings of Machine Learning Research; Vuosikerta 202).

    Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

    Open access
    Tiedosto
    3 Lataukset (Pure)
  • Simplified Temporal Consistency Reinforcement Learning

    Zhao, Y., Zhao, W., Boney, R., Kannala, J. & Pajarinen, J., heinäk. 2023, Proceedings of the 40th International Conference on Machine Learning. Krause, A., Brunskill, E., Cho, K., Engelhardt, B., Sabato, S. & Scarlett, J. (toim.). JMLR, s. 42227-42246 20 Sivumäärä (Proceedings of Machine Learning Research; Vuosikerta 202).

    Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

    Open access
    Tiedosto
    6 Lataukset (Pure)