Block HSIC Lasso: Model-free biomarker detection for ultra-high dimensional data

  • Héctor Climente-González
  • , Chloé Agathe Azencott
  • , Samuel Kaski
  • , Makoto Yamada*
  • *Tämän työn vastaava kirjoittaja

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

68 Sitaatiot (Scopus)
144 Lataukset (Pure)

Abstrakti

Motivation: Finding non-linear relationships between biomolecules and a biological outcome is computationally expensive and statistically challenging. Existing methods have important drawbacks, including among others lack of parsimony, non-convexity and computational overhead. Here we propose block HSIC Lasso, a non-linear feature selector that does not present the previous drawbacks. Results: We compare block HSIC Lasso to other state-of-the-art feature selection techniques in both synthetic and real data, including experiments over three common types of genomic data: gene-expression microarrays, single-cell RNA sequencing and genome-wide association studies. In all cases, we observe that features selected by block HSIC Lasso retain more information about the underlying biology than those selected by other techniques. As a proof of concept, we applied block HSIC Lasso to a single-cell RNA sequencing experiment on mouse hippocampus. We discovered that many genes linked in the past to brain development and function are involved in the biological differences between the types of neurons.

AlkuperäiskieliEnglanti
Artikkelibtz333
Sivuti427-i435
JulkaisuBioinformatics
Vuosikerta35
Numero14
DOI - pysyväislinkit
TilaJulkaistu - 15 heinäk. 2019
OKM-julkaisutyyppiA1 Alkuperäisartikkeli tieteellisessä aikakauslehdessä

Rahoitus

Computational resources and support were provided by RIKEN AIP. H.C-G. was funded by the European Union’s Horizon 2020 research and innovation program under the Marie Skłodowska-Curie [666003]. S.K. was supported by the Academy of Finland (292334, 319264). M.Y. was supported by the JST PRESTO program JPMJPR165A and partly supported by MEXT KAKENHI 16H06299 and the RIKEN engineering network funding.

Sormenjälki

Sukella tutkimusaiheisiin 'Block HSIC Lasso: Model-free biomarker detection for ultra-high dimensional data'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.
  • Interaktiivinen koneoppiminen useista biodatalähteistä

    Kaski, S. (Vastuullinen johtaja), Bhat, A. (Projektin jäsen), Trinh, T. (Projektin jäsen), Scherting, B. (Projektin jäsen), Siren, J. (Projektin jäsen), Gadd, C. (Projektin jäsen), Hegde, P. (Projektin jäsen), Chauhan, R. (Projektin jäsen), Jain, A. (Projektin jäsen), Jälkö, J. (Projektin jäsen), Hämäläinen, A. (Projektin jäsen), Tran, A. (Projektin jäsen) & Shen, Z. (Projektin jäsen)

    01/01/201931/08/2021

    Projekti: Academy of Finland: Other research funding

  • Interaktiivinen koneoppiminen useista biodatalähteistä

    Kaski, S. (Vastuullinen johtaja) & Filstroff, L. (Projektin jäsen)

    01/01/201631/08/2021

    Projekti: Academy of Finland: Other research funding

Siteeraa tätä