Time Budget Management in Multifunction Radars Using Reinforcement Learning

Petteri Pulkkinen, Tuomas Aittomaki, Anders Strom, Visa Koivunen

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

11 Lataukset (Pure)

Abstrakti

An adaptive revisit interval selection (RIS) in multifunction radars is an integral part of efficient time budget management (TBM). In this paper, the RIS problem is formulated as a Markov decision process (MDP) with unknown state transition probabilities and reward distributions. A reward function is proposed to minimize the tracking load (TL) while maintaining the track loss probability (TLP) at a tolerable level. The reinforcement learning (RL) problem is solved using the Q-learning algorithm with an epsilon-greedy policy. Compared to a baseline algorithm, the RL approach was capable of maintaining the tracks while reducing the tracking load significantly.

AlkuperäiskieliEnglanti
Otsikko2021 IEEE Radar Conference
AlaotsikkoRadar on the Move, RadarConf 2021
KustantajaIEEE
Sivumäärä6
ISBN (elektroninen)9781728176093
DOI - pysyväislinkit
TilaJulkaistu - 7 toukokuuta 2021
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaIEEE Radar Conference - Atlanta, Yhdysvallat
Kesto: 8 toukokuuta 202114 toukokuuta 2021

Julkaisusarja

NimiProceedings of the IEEE Radar Conference
Vuosikerta2021-May
ISSN (painettu)1097-5659
ISSN (elektroninen)2375-5318

Conference

ConferenceIEEE Radar Conference
LyhennettäRadarConf
Maa/AlueYhdysvallat
KaupunkiAtlanta
Ajanjakso08/05/202114/05/2021

Sormenjälki

Sukella tutkimusaiheisiin 'Time Budget Management in Multifunction Radars Using Reinforcement Learning'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä