Efficient and Principled Multi-Agent Reinforcement Learning

Projektin yksityiskohdat

Tiivistelmä

Vahvistusoppiminen on lupaava lähestymistapa sellaisten järjestelmien optimointiin joissa on monta toimijaa (agenttia). Tälläisiä moniagentti-järjestelmiä voivat muodostaa esimerkiksi yhteistyötä tekevät robotit tai langattomat laitteet. Tämän projektin tavoite on lisätä ymmärrystä siitä, kuinka hallita oppimista moniagentti-järjestelmissä. Oppimisen pitää olla nopeaa, mutta samalla päätyä tarkkaan lopputulokseen. Erityisesti tämä projekti: (i) Yrittää välttää turhan tiedon keräämistä tutkimalla uusia laskennallisia malleja tulevien tapahtumien ennustamiseksi. (ii) Kehittää uusia menetelmiä tarkoituksena helpottaa laskentaa merkittävästi. Uudet menetelmät aloittavat oppimisen helpoista tehtävistä ja automaattisesti siirtyvät kohti vaikeaa varsinaista tehtävää. (iii) Edistää suunnittelumenetelmiä, jotka etukäteen arvioivat mikä tieto on arvokasta sekä laskennallisten mallien oppimiseen, että agenttien toiminnan parantamiseen.
AkronyymiMARL
TilaKäynnissä
Todellinen alku/loppupvm01/09/202331/08/2027

Yhteistyöpartnerit

Sormenjälki

Tutustu tutkimuksen aiheisiin, joita tämä projekti koskee. Nämä merkinnät luodaan taustalla olevien stipendien/apurahojen perusteella. Yhdessä ne muodostavat ainutlaatuisen sormenjäljen.