Infinite horizon discounted dynamic programming subject to total variation ambiguity on conditional distribution

Ioannis Tzortzis, Charalambos D. Charalambous, Themistoklis Charalambous

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Abstrakti

We analyze the infinite horizon minimax discounted cost Markov Control Model (MCM), for a class of controlled process conditional distributions, which belong to a ball, with respect to total variation distance metric, centered at a known nominal controlled conditional distribution with radius R ϵ [0, 2], in which the minimization is over the control strategies and the maximization is over conditional distributions. Through our analysis (i) we derive a new discounted dynamic programming equation, (ii) we show the associated contraction property, and (iii) we develop a new policy iteration algorithm. Finally, the application of the new dynamic programming and the corresponding policy iteration algorithm are shown via an illustrative example.

AlkuperäiskieliEnglanti
Otsikko2016 IEEE 55th Conference on Decision and Control, CDC 2016
KustantajaIEEE
Sivut2010-2015
Sivumäärä6
ISBN (elektroninen)9781509018376
DOI - pysyväislinkit
TilaJulkaistu - 27 joulukuuta 2016
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaIEEE Conference on Decision and Control - ARIA Resort & Casino, Las Vegas, Yhdysvallat
Kesto: 12 joulukuuta 201614 joulukuuta 2016
Konferenssinumero: 55

Conference

ConferenceIEEE Conference on Decision and Control
LyhennettäCDC
MaaYhdysvallat
KaupunkiLas Vegas
Ajanjakso12/12/201614/12/2016

Sormenjälki Sukella tutkimusaiheisiin 'Infinite horizon discounted dynamic programming subject to total variation ambiguity on conditional distribution'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

  • Siteeraa tätä

    Tzortzis, I., Charalambous, C. D., & Charalambous, T. (2016). Infinite horizon discounted dynamic programming subject to total variation ambiguity on conditional distribution. teoksessa 2016 IEEE 55th Conference on Decision and Control, CDC 2016 (Sivut 2010-2015). [7798559] IEEE. https://doi.org/10.1109/CDC.2016.7798559