Improving very large vocabulary language modeling and decoding for speech recognition in morphologically rich languages

Julkaisun otsikon käännös: Menetelmiä laajan sanaston kielimallinnukseen ja puheentunnistukseen morfologisesti rikkaille kielille

Matti Varjokallio

Tutkimustuotos: Doctoral ThesisCollection of Articles

Abstrakti

Morfologisesti rikkaiden ja agglutinatiivisten kielten laajan sanaston puheentunnistuksen yksi haasteista on sanaston suuri koko. Tunnistussanaston täytyy monissa tunnistustehtävissä sisältää miljoonia sanamuotoja. Tämä on ongelmallista puheentunnistimelle, koska useissa käyttötapauksissa tavoitteena olisi reaaliaikainen tunnistus ja eri hypoteesien määrä on suuri. Tyypillinen moderni puheentunnistin käyttää todennäköisyyksiin perustuvaa kielimallia eri tunnistushypoteesien pisteytykseen. Tarkkojen kielimallien estimointi tekstikorpuksesta on myös haastavaa datan harvuuden vuoksi. Tähän asti yleisimmin käytetty lähestymistapa agglutinatiivisten kielten puheentunnistukseen on ollut segmentoida sanat lyhyemmiksi ja useammin esiintyviksi sanapaloiksi. Tällä tavalla vältetään datan harvuudesta aiheutuvat ongelmat kielimallin estimoinnissa. Mikäli kaikki sanapalojen väliset ketjut sallitaan, tunnistimen sanasto on rajoittamaton. Tämä väitöskirja keskittyy menetelmiin, joissa käytetään rajattua, mutta erittäin isoa tunnistussanastoa. Tällainen tunnistin pystyy sanapaloihin perustuvan kielimallin lisäksi hyödyntämään myös kielimalleja, joissa yksiköinä ovat kokonaiset sanat tai erilaiset sanojen luokittelut. Tapauksessa, jossa käytetään pelkästään sanapaloihin perustuvaa kielimallia, tutkitaan myös uutta tapaa konstruoida tunnistin käyttäen rajattua sanastoa. Tässä tapauksessa tunnistussanastoa on helppo laajentaa erilaisten muiden kieliresurssien kuten sanastojen tai morfologisten analysaattorien avulla. Väitöskirjassa osoitetaan, että rajatun sanaston tunnistus on varteenotettava vaihtoehto monissa tunnistustehtävissä myös morfologisesti rikkaille kielille. Tunnistin voi myös tässä tapauksessa toimia reaaliaikaisesti tai jopa nopeammin kuin rajaamattoman sanaston tunnistus. Rajatun sanaston tunnistuksessa hyvänä puolena on, että vältetään kieliopillisesti väärien sanamuotojen tunnistus. Tunnistustarkkuus voi myöskin olla parempi kuin rajoittamattoman sanaston tunnistuksessa, jos tunnistussanaston kattavuus on tarpeeksi suuri. Väitöskirjan yhdessä osassa ihmisten sanatunnistuksen tarkkuutta tutkitaan hyödyntäen tilastollisia morfologisia malleja visuaalisessa leksikaalisessa päätöstehtävässä. Tässä kokeessa myös koehenkilöiden silmänliikkeitä mitattiin silmänliikeseurannalla. Morfessor Baseline -menetelmä, joka pilkkoo vain harvinaiset sanat, ennusti mittaustuloksia hyvin eri koeasetelmissa. Tulos tukee vastaavaa mallia ihmisten sanantunnistuksessa.
Julkaisun otsikon käännösMenetelmiä laajan sanaston kielimallinnukseen ja puheentunnistukseen morfologisesti rikkaille kielille
AlkuperäiskieliEnglanti
PätevyysTohtorintutkinto
Myöntävä instituutio
  • Aalto-yliopisto
Valvoja/neuvonantaja
  • Kurimo, Mikko, Vastuuprofessori
  • Virpioja, Sami, Ohjaaja
Kustantaja
Painoksen ISBN978-952-64-0180-5
Sähköinen ISBN978-952-64-0181-2
TilaJulkaistu - 2020
OKM-julkaisutyyppiG5 Artikkeliväitöskirja

Tutkimusalat

  • automaattinen puheentunnistus
  • morfologisesti rikkaat kielet
  • kielimallinnus
  • psykolingvistiikka

Sormenjälki

Sukella tutkimusaiheisiin 'Menetelmiä laajan sanaston kielimallinnukseen ja puheentunnistukseen morfologisesti rikkaille kielille'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä