Random Search Algorithms for Optimal Control

Julkaisun otsikon käännös: Satunnaishakualgoritmeja optimaaliseen säätöön

Joose Rajamäki

Tutkimustuotos: Doctoral ThesisCollection of Articles

Abstrakti

Optimisäätö on tärkeä väline useilla sovellusalueilla, se on esimerkiksi keskeinen työkalu robotiikassa. Monet laajasti käytössä olevat menetelmät kuten differentiaalinen dynaaminen optimointi (DDP) perustuvat ohjatun järjestelmän dynamiikan ja kohdefunktion differentiointiin. Oletus järjestelmän mallin differentioituvuudesta ei päde monille järjestelmille, joita halutaan säätää. Esimerkiksi törmäykset rikkovat kyseisen olettaman. Tässä tapauksessa on otettava käyttöön satunnaishaku- eli Monte Carlo algoritmit. Tässä väitöskirjassa esitetyt satunnaishakualgoritmit jakautuvat kahteen kategoriaan. Toinen näistä on lokaalisti optimaaliset satunnaishakuun perustuvat liikerataoptimointimenetelmät. Toinen kategorioista on reaaliaikaiseen ohjaukseen kykenevät Monte Carlo puuhakumenetelmät (MCTS), joita on täydennetty koneoppimismenetelmillä, joita koulutetaan valvotulla oppimisella.  Tämä väitöskirja esittää näytteistetyn differentiaalisen dynaamisen optimoinnin (SaDDP), joka on differentiaalisesta dynaamisesta optimoinnista johdettu satunnaishakuun perustuva liikerataoptimointimenetelmä. SaDDP on johdettu rinnastamalla DDP:ssä käytetyn Taylor-kehitelmän suureet moniulotteisen normaalijakauman tunnuslukuihin. Nämä tunnusluvut voidaan laskea uudelleen näytteistä sen sijaan, että käytettäisiin differentiointia niiden laskemiseen. Tämä väitöskirja esittää myös tapoja SaDDP:n tehokkaaseen regularisoimiseen.  Tässä väitöskirjassa esitetyt reaaliaikaiseen säätöön kykenevät MCTS-menetelmät mahdollistavat monimutkaisten järjestelmien, kuten 3D-hahmojen, ohjaamisen. Menetelmät suorittavat loitontuvan horisontin haun ja käyttävät haun tuottamaa dataa koneoppimismallien opettamiseen. Nämä koneoppimismallit vuorostaan avustavat tulevia hakuja. Kyseinen loitontuvan horisontin haku yhdistettynä valvottuun koneoppimiseen konvergoi nopeasti ja saa algoritmin oppimaan vakaasti.  Tämän väitöskirjan MCTS-menetelmät yhdistävät informaatiota useista lähteistä. Tässä väitöskirjassa esitetään, miten näiden lähteiden sisältämä informaatio voidaan yhdistää siten, että menetelmä sopeutuu tilanteisiin, jossa informaatio on yhtenevää taikka ristiriitaista. Näiden uudenlaisten hakualgoritmien lisäksi tässä väitöskirjassa esitetään MCTS-haku, jota avustaa generatiivinen neuroverkko. Tämä yhdistelmä mahdollistaa sen, että neuroverkko voi oppia suorittamaan useita vaihtoehtoisia toimintoja kussakin tilassa.
Julkaisun otsikon käännösSatunnaishakualgoritmeja optimaaliseen säätöön
AlkuperäiskieliEnglanti
PätevyysTohtorintutkinto
Myöntävä instituutio
  • Aalto-yliopisto
Valvoja/neuvonantaja
  • Hämäläinen, Perttu, Vastuuprofessori
  • Hämäläinen, Perttu, Ohjaaja
  • Kyrki, Ville, Ohjaaja
Kustantaja
Painoksen ISBN978-952-60-8155-7
Sähköinen ISBN978-952-60-8156-4
TilaJulkaistu - 2018
OKM-julkaisutyyppiG5 Artikkeliväitöskirja

Tutkimusalat

  • Monte Carlo -puuhaku
  • differentiaalinen dynaaminen optimointi

Sormenjälki

Sukella tutkimusaiheisiin 'Satunnaishakualgoritmeja optimaaliseen säätöön'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä