Abstrakti
Speech foundation models such as wav2vec 2.0 have made it possible to develop highly accurate models for low-resourced languages using a limited amount of speech data. For optimal results, the pre-training should already include data from the target language, but unfortunately, none of the available foundation models include Northern Sámi. In this work, we explore various ways of preparing the foundation model for the Northern Sámi, including continued pre-training with a small untranscribed corpus and our new extended fine-tuning method. The extended fine-tuning starts from an already fine-tuned ASR model and augments it with new output units for the unique Sámi characters before new fine-tuning with transcribed Sámi data. Our results demonstrate the benefits of these advanced adaptation techniques, as both approaches lead to better performance than the direct fine-tuning-based adaptation.
| Alkuperäiskieli | Englanti |
|---|---|
| Otsikko | Interspeech 2024 |
| Kustantaja | International Society for Computers and Their Applications (ISCA) |
| Sivut | 2539-2543 |
| Sivumäärä | 5 |
| DOI - pysyväislinkit | |
| Tila | Julkaistu - 2024 |
| OKM-julkaisutyyppi | A4 Artikkeli konferenssijulkaisussa |
| Tapahtuma | Interspeech - Kos Island, Kreikka Kesto: 1 syysk. 2024 → 5 syysk. 2024 |
Julkaisusarja
| Nimi | Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH |
|---|---|
| Kustantaja | International Speech Communication Association (ISCA) |
| ISSN (painettu) | 2308-457X |
Conference
| Conference | Interspeech |
|---|---|
| Maa/Alue | Kreikka |
| Kaupunki | Kos Island |
| Ajanjakso | 01/09/2024 → 05/09/2024 |
Sormenjälki
Sukella tutkimusaiheisiin 'Exploring adaptation techniques of large speech foundation models for low-resource ASR: a case study on Northern Sámi'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.Projektit
- 2 Päättynyt
-
LAREINA: LAREINA - Language Resource Infrastructure for AI
Kurimo, M. (Vastuullinen johtaja), Porjazovski, D. (Projektin jäsen), Virkkunen, A. (Projektin jäsen), Getman, Y. (Projektin jäsen), Grósz, T. (Projektin jäsen), Rouhe, A. (Projektin jäsen), Sõrmus, B. (Projektin jäsen), Bijoy, M. (Projektin jäsen), Moisio, A. (Projektin jäsen) & Shen, J. (Projektin jäsen)
01/01/2023 → 31/12/2025
Projekti: BF Co-Innovation
-
USSEE: Understanding Speech and Scene with Ears and Eyes
Kurimo, M. (Vastuullinen johtaja), Virkkunen, A. (Projektin jäsen), Sarvas, M. (Projektin jäsen) & Grósz, T. (Projektin jäsen)
01/01/2022 → 31/12/2024
Projekti: RCF Academy Project
Laitteet
Siteeraa tätä
- APA
- Author
- BIBTEX
- Harvard
- Standard
- RIS
- Vancouver