Modelling Human Decision-making based on Aggregate Observation Data

Antti Kangasrääsiö, Samuel Kaski

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference article in proceedingsProfessional

119 Lataukset (Pure)

Abstrakti

Being able to infer the goals, preferences and limitations of humans is of key importance in designing interactive systems. Reinforcement learning (RL) models are a promising direction of research, as they are able to model how the behavioural patterns of users emerge from the task and environment structure. One limitation with traditional inference methods for RL models is the strict requirements for observation data; both the states of the environment and the actions of the agent need to be observed at each step of the task. This has prevented RL models from being used in situations where such fine-grained observations are not available. In this extended abstract we present results from a recent study where we demonstrated how inference can be performed for RL models even when the observation data is significantly more coarse-grained.
The idea is to solve the inverse reinforcement learning (IRL) problem using approximate Bayesian computation sped up with Bayesian optimization.
AlkuperäiskieliEnglanti
OtsikkoHuman In The Loop-ML Workshop at ICML
JulkaisupaikkaSydney
KustantajaHuman in the Loop Machine Learning
Sivumäärä4
TilaJulkaistu - 2017
OKM-julkaisutyyppiD3 Artikkeli ammatillisessa konferenssijulkaisussa
TapahtumaHuman in the Loop Machine Learning; ICML Workshop - Sydney, Austraalia
Kesto: 11 elok. 201711 elok. 2017
https://machlearn.gitlab.io/hitl2017/

Workshop

WorkshopHuman in the Loop Machine Learning; ICML Workshop
LyhennettäHITL
Maa/AlueAustraalia
KaupunkiSydney
Ajanjakso11/08/201711/08/2017
www-osoite

Sormenjälki

Sukella tutkimusaiheisiin 'Modelling Human Decision-making based on Aggregate Observation Data'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.
  • Interaktiivinen koneoppiminen useista biodatalähteistä

    Kaski, S. (Vastuullinen johtaja) & Filstroff, L. (Projektin jäsen)

    01/01/201631/08/2021

    Projekti: Academy of Finland: Other research funding

  • Interaktiivinen koneoppiminen useista biodatalähteistä

    Kaski, S. (Vastuullinen johtaja), Musaev, M. (Projektin jäsen), Hegde, P. (Projektin jäsen), Rogers-Smith, C. (Projektin jäsen), Aushev, A. (Projektin jäsen), Chen, Y. (Projektin jäsen), Afrabandpey, H. (Projektin jäsen), Bhat, A. (Projektin jäsen), Çelikok, M. M. (Projektin jäsen), Kaurila, K. (Projektin jäsen), Siren, J. (Projektin jäsen), Blomstedt, P. (Projektin jäsen), Qin, X. (Projektin jäsen), Jälkö, J. (Projektin jäsen), Eranti, P. (Projektin jäsen), Honkamaa, J. (Projektin jäsen), Sundin, I. (Projektin jäsen), Peltola, T. (Projektin jäsen), Shen, Z. (Projektin jäsen), Blomqvist, K. (Projektin jäsen), Kangas, J.-K. (Projektin jäsen), Daee, P. (Projektin jäsen), Pesonen, H. (Projektin jäsen) & Reinvall, J. (Projektin jäsen)

    01/01/201631/12/2018

    Projekti: Academy of Finland: Other research funding

Siteeraa tätä