On Missing Labels, Long-tails and Propensities in Extreme Multi-label Classification

Erik Schultheis, Rohit Babbar, Marek Wydmuch, Krzysztof Dembczynski

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference article in proceedingsScientificvertaisarvioitu

25 Sitaatiot (Scopus)
77 Lataukset (Pure)

Abstrakti

The propensity model introduced by Jain et al has become a standard approach for dealing with missing and long-tail labels in extreme multi-label classification (XMLC). In this paper, we critically revise this approach showing that despite its theoretical soundness, its application in contemporary XMLC works is debatable. We exhaustively discuss the flaws of the propensity-based approach, and present several recipes, some of them related to solutions used in search engines and recommender systems, that we believe constitute promising alternatives to be followed in XMLC.

AlkuperäiskieliEnglanti
OtsikkoProceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
KustantajaACM
Sivut1547–1557
Sivumäärä11
ISBN (elektroninen)978-1-4503-9385-0
DOI - pysyväislinkit
TilaJulkaistu - elok. 2022
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa
TapahtumaACM SIGKDD International Conference on Knowledge Discovery and Data Mining - Washington, Yhdysvallat
Kesto: 14 elok. 202218 elok. 2022
Konferenssinumero: 28
https://kdd.org/kdd2022/

Conference

ConferenceACM SIGKDD International Conference on Knowledge Discovery and Data Mining
LyhennettäKDD
Maa/AlueYhdysvallat
KaupunkiWashington
Ajanjakso14/08/202218/08/2022
www-osoite

Sormenjälki

Sukella tutkimusaiheisiin 'On Missing Labels, Long-tails and Propensities in Extreme Multi-label Classification'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä