Interactive Prior Elicitation of Feature Similarities for Small Sample Size Prediction

Homayun Afrabandpey, Tomi Peltola, Samuel Kaski

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference article in proceedingsScientificvertaisarvioitu

6 Sitaatiot (Scopus)

Abstrakti

Regression under the "small n$, large p" condition, of small sample size n and large number of features p in the learning data set, is a recurring setting in which learning from data is difficult. With prior knowledge about relationships of the features, p can effectively be reduced, but explicating such prior knowledge is difficult for experts. In this paper we introduce a new method for eliciting expert prior knowledge about the similarity of the roles of features in the prediction task. The key idea is to use an interactive multidimensional-scaling (MDS) type scatterplot display of the features to elicit the similarity relationships, and then use the elicited relationships in the prior distribution of prediction parameters. Specifically, for learning to predict a target variable with Bayesian linear regression, the feature relationships are used to construct a Gaussian prior with a full covariance matrix for the regression coefficients. Evaluation of our method in experiments with simulated and real users on text data confirm that prior elicitation of feature similarities improves prediction accuracy. Furthermore, elicitation with an interactive scatterplot display outperforms straightforward elicitation where the users choose feature pairs from a feature list.
AlkuperäiskieliEnglanti
OtsikkoProceedings of the 25th Conference on User Modeling, Adaptation and Personalization
JulkaisupaikkaBratislava, Slovakia
KustantajaACM
Sivut265-269
Sivumäärä4
ISBN (painettu)978-1-4503-4635-1
DOI - pysyväislinkit
TilaJulkaistu - 10 heinäk. 2017
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa
TapahtumaConference on User Modeling, Adaptation and Personalization - Slovak University of Technology, Bratislava, Slovakia
Kesto: 9 heinäk. 201712 heinäk. 2017
http://www.um.org/umap2017/

Conference

ConferenceConference on User Modeling, Adaptation and Personalization
LyhennettäUMAP
Maa/AlueSlovakia
KaupunkiBratislava
Ajanjakso09/07/201712/07/2017
www-osoite

Sormenjälki

Sukella tutkimusaiheisiin 'Interactive Prior Elicitation of Feature Similarities for Small Sample Size Prediction'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.
  • Interaktiivinen koneoppiminen useista biodatalähteistä

    Kaski, S. (Vastuullinen tutkija) & Filstroff, L. (Projektin jäsen)

    01/01/201631/08/2021

    Projekti: Academy of Finland: Other research funding

  • Interaktiivinen koneoppiminen useista biodatalähteistä

    Kaski, S. (Vastuullinen tutkija), Reinvall, J. (Projektin jäsen), Chen, Y. (Projektin jäsen), Daee, P. (Projektin jäsen), Qin, X. (Projektin jäsen), Jälkö, J. (Projektin jäsen), Pesonen, H. (Projektin jäsen), Blomstedt, P. (Projektin jäsen), Eranti, P. (Projektin jäsen), Hegde, P. (Projektin jäsen), Siren, J. (Projektin jäsen), Peltola, T. (Projektin jäsen), Celikok, M. M. (Projektin jäsen), Sundin, I. (Projektin jäsen), Kangas, J.-K. (Projektin jäsen), Afrabandpey, H. (Projektin jäsen), Honkamaa, J. (Projektin jäsen), Shen, Z. (Projektin jäsen) & Aushev, A. (Projektin jäsen)

    01/01/201631/12/2018

    Projekti: Academy of Finland: Other research funding

Siteeraa tätä