Tekniikoita puheen ymmärrettävyyden parantamiseen mobiililaitteissa

Emma Jokinen

Tutkimustuotos: Doctoral ThesisCollection of Articles

Abstrakti

Kuluttajat voivat nykypäivänä käyttää mobiililaitteitaan lähes missä ja milloin vain. Tämä tarkoittaa puolestaan sitä, että ympäristössä oleva melu häiritsee kuuntelijaa tehden puhujan viestin ymmärtämisestä haastavampaa. Tilannetta vaikeuttaa entisestään se, että puhuja ja kuuntelija ovat usein fyysisesti eri paikoissa puhuessaan keskenään. Tällöin puhuja ei välttämättä aina pysty mukauttamaan puhetyyliään kuuntelijan ympäristön mukaan, kuten normaalisti tapahtuisi kasvokkain käytävässä keskustelussa. Mobiililaitteissa tapahtuvan kommunikaation sujuvuutta meluisissa tilanteissa voidaan kuitenkin lisätä ymmärrettävyyden parantamiseen tähtäävillä tekniikoilla. Tässä väitöskirjassa on kehitetty puheen ymmärrettävyyden parantamiseen käytettäviä algoritmeja, jotka periaatteessa soveltuvat reaaliaikaiseen kommunikaatioon mobiililaitteissa. Nämä algoritmit on tarkoitettu erityisesti puheen jälkikäsittelyyn vastaanottavassa laitteessa ja niiden tavoitteena on kuuntelijan ympärillä olevan taustamelun vaikutusten vähentäminen. Reaaliaikaisuus vaatimuksena tarkoittaa, että algoritmien aiheuttama viive on rajoitettu, ja tästä syystä prosessointi tehdään lyhyitä kehyksiä käyttäen. Väitöskirjassa esitellään useita algoritmeja, joiden suorituskyky osoitetaan simuloitua puhelinyhteyttä hyödyntävien kuuntelukokeiden avulla. Suurin osa ehdotetuista algoritmeista pyrkii muuttamaan puhetta, kuten ihminen luonnollisesti tekisi puhuessaan meluisassa tilanteessa. Puheen ymmärrettävyyttä parantavien algoritmien lisäksi työssä esitellään piirteiden irroitukseen soveltuva tekniikka, jolla voidaan estimoida puheen äänilähteen aiheuttama spektrin kallistus suoraan koodatusta puheesta. Lisäksi on tutkittu puheessa olevan melun vaikutuksia jälkikäsittelyyn vastaanottimessa. Työssä kehitetyt tekniikat parantavat vastaanotetun puheen ymmärrettävyyttä jopa 40 prosenttiyksikön verran prosessoimattomaan puheeseen verrattuna.
Julkaisun otsikon käännösTekniikoita puheen ymmärrettävyyden parantamiseen mobiililaitteissa
AlkuperäiskieliEnglanti
PätevyysTohtorintutkinto
Myöntävä instituutio
  • Aalto-yliopisto
Valvoja/neuvonantaja
  • Alku, Paavo, Valvoja
Kustantaja
Painoksen ISBN978-952-60-7679-9
Sähköinen ISBN978-952-60-7684-3
TilaJulkaistu - 2017
OKM-julkaisutyyppiG5 Tohtorinväitöskirja (artikkeli)

Tutkimusalat

  • puheen ymmärrettävyyden parannus
  • puhelinpuhe
  • taustamelu
  • ihmisen puheentuotto

Sormenjälki Sukella tutkimusaiheisiin 'Tekniikoita puheen ymmärrettävyyden parantamiseen mobiililaitteissa'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä