Clustering Nursing Sentences-Comparing Three Sentence Embedding Methods

Hans Moen*, Henry Suhonen, Sanna Salanterä, Tapio Salakoski, Laura Maria Peltonen

*Tämän työn vastaava kirjoittaja

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

1 Sitaatiot (Scopus)
49 Lataukset (Pure)

Abstrakti

In health sciences, high-quality text embeddings may augment qualitative data analysis of large amounts of text by enabling, e.g., searching and clustering of health information. This study aimed to evaluate three different sentence-level embedding methods in clustering sentences in nursing narratives from individual patients' hospital care episodes. Two of these embeddings are generated from language models based on the BERT framework, and the third on the Sent2Vec method. These embedding methods were used to cluster sentences from 20 patient care episodes and the results were manually evaluated. Findings suggest that the best clusters were produced by the embeddings from a BERT model fine-tuned for the proxy task of predicting subject headings for nursing text.

AlkuperäiskieliEnglanti
OtsikkoChallenges of Trustable AI and Added-Value on Health - Proceedings of MIE 2022
ToimittajatBrigitte Seroussi, Patrick Weber, Ferdinand Dhombres, Cyril Grouin, Jan-David Liebe, Jan-David Liebe, Jan-David Liebe, Sylvia Pelayo, Andrea Pinna, Bastien Rance, Bastien Rance, Lucia Sacchi, Adrien Ugon, Adrien Ugon, Arriel Benis, Parisis Gallos
KustantajaIOS Press
Sivut854-858
Sivumäärä5
ISBN (elektroninen)978-1-64368-284-6
DOI - pysyväislinkit
TilaJulkaistu - 25 toukok. 2022
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa
TapahtumaMedical Informatics Europe Conference - Nice, Ranska
Kesto: 27 toukok. 202230 toukok. 2022
Konferenssinumero: 32

Julkaisusarja

NimiStudies in Health Technology and Informatics
KustantajaIOS Press
Vuosikerta294
ISSN (painettu)0926-9630
ISSN (elektroninen)1879-8365

Conference

ConferenceMedical Informatics Europe Conference
LyhennettäMIE
Maa/AlueRanska
KaupunkiNice
Ajanjakso27/05/202230/05/2022

Sormenjälki

Sukella tutkimusaiheisiin 'Clustering Nursing Sentences-Comparing Three Sentence Embedding Methods'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä