Abstrakti
Morfologisesti rikkaiden ja agglutinatiivisten kielten laajan sanaston puheentunnistuksen yksi haasteista on sanaston suuri koko. Tunnistussanaston täytyy monissa tunnistustehtävissä sisältää miljoonia sanamuotoja.
Tämä on ongelmallista puheentunnistimelle, koska useissa käyttötapauksissa tavoitteena olisi reaaliaikainen tunnistus ja eri hypoteesien määrä on suuri. Tyypillinen moderni puheentunnistin käyttää todennäköisyyksiin perustuvaa kielimallia eri tunnistushypoteesien pisteytykseen. Tarkkojen kielimallien estimointi tekstikorpuksesta on myös haastavaa datan harvuuden vuoksi.
Tähän asti yleisimmin käytetty lähestymistapa agglutinatiivisten kielten puheentunnistukseen on ollut segmentoida sanat lyhyemmiksi ja useammin esiintyviksi sanapaloiksi. Tällä tavalla vältetään datan harvuudesta aiheutuvat ongelmat kielimallin estimoinnissa. Mikäli kaikki sanapalojen väliset ketjut sallitaan, tunnistimen sanasto on rajoittamaton.
Tämä väitöskirja keskittyy menetelmiin, joissa käytetään rajattua, mutta erittäin isoa tunnistussanastoa. Tällainen tunnistin pystyy sanapaloihin perustuvan kielimallin lisäksi hyödyntämään myös kielimalleja, joissa yksiköinä ovat kokonaiset sanat tai erilaiset sanojen luokittelut. Tapauksessa, jossa käytetään pelkästään sanapaloihin perustuvaa kielimallia, tutkitaan myös uutta tapaa konstruoida tunnistin käyttäen rajattua sanastoa. Tässä tapauksessa tunnistussanastoa on helppo laajentaa erilaisten muiden kieliresurssien kuten sanastojen tai morfologisten analysaattorien avulla. Väitöskirjassa osoitetaan, että rajatun sanaston tunnistus on varteenotettava vaihtoehto monissa tunnistustehtävissä myös morfologisesti rikkaille kielille. Tunnistin voi myös tässä tapauksessa toimia reaaliaikaisesti tai jopa nopeammin kuin rajaamattoman sanaston tunnistus. Rajatun sanaston tunnistuksessa hyvänä puolena on, että vältetään kieliopillisesti väärien sanamuotojen tunnistus. Tunnistustarkkuus voi myöskin olla parempi kuin rajoittamattoman sanaston tunnistuksessa, jos tunnistussanaston kattavuus on tarpeeksi suuri.
Väitöskirjan yhdessä osassa ihmisten sanatunnistuksen tarkkuutta tutkitaan hyödyntäen tilastollisia morfologisia malleja visuaalisessa leksikaalisessa päätöstehtävässä. Tässä kokeessa myös koehenkilöiden silmänliikkeitä mitattiin silmänliikeseurannalla. Morfessor Baseline -menetelmä, joka pilkkoo vain harvinaiset sanat, ennusti mittaustuloksia hyvin eri koeasetelmissa. Tulos tukee vastaavaa mallia ihmisten sanantunnistuksessa.
Julkaisun otsikon käännös | Menetelmiä laajan sanaston kielimallinnukseen ja puheentunnistukseen morfologisesti rikkaille kielille |
---|---|
Alkuperäiskieli | Englanti |
Pätevyys | Tohtorintutkinto |
Myöntävä instituutio |
|
Valvoja/neuvonantaja |
|
Kustantaja | |
Painoksen ISBN | 978-952-64-0180-5 |
Sähköinen ISBN | 978-952-64-0181-2 |
Tila | Julkaistu - 2020 |
OKM-julkaisutyyppi | G5 Artikkeliväitöskirja |
Tutkimusalat
- automaattinen puheentunnistus
- morfologisesti rikkaat kielet
- kielimallinnus
- psykolingvistiikka