Optimistic policy iteration and natural actor-critic: A unifying view and a non-optimality result

    Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference article in proceedingsScientificvertaisarvioitu

    5 Sitaatiot (Scopus)
    AlkuperäiskieliEnglanti
    OtsikkoAdvances in Neural Information Processing Systems 26, Lake Tahoe, Nevada, United States, December 5 - December 8, 2013
    TilaJulkaistu - 2013
    OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa

    Julkaisusarja

    Nimi
    ISSN (painettu)1367-4803

    Siteeraa tätä