Poikkitieteellinen parametrisen puhesynteesin tutkimusprojekti

Projektin yksityiskohdat

Tiivistelmä

Poikkitieteellisen tutkimushankkeen tavoitteena on kehittää uudentyyppisiä tilastollisen puhesynteesin menetelmiä. Hankkeessa tullaan tutkimaan erityisesti tilastollisen synteesin ydintä, vokooderia, missä tullaan hyödyntämään ihmisen äänentuoton fysiologiaa paremmin mallintavia signaalinkäsittelyn menetelmiä. Menetelmät perustuvat ns. glottaaliseen käänteissuodatukseen (GIF), millä tarkoitetaan laskennallista inversiomenetelmään, jolla pyritään hajottamaan puheääni kahteen osaan, äänihuuliherätteeseen ja ääniväylään. Tutkimus keskittyy varsinkin sellaisten uusien GIF-tekniikoiden kehittämiseen, joilla ihmisen puheääni voidaan parametroida nykytekniikoihin verrattuna tehokkaammin myös haastavasta äänimateriaalista kuten naisten tai lasten puheesta. Menetelmät tullaan upottamaan synteesijärjestelmään puheen syntetisoimiseksi mielivaltaisesta tekstistä. Projektin tuloksia voidaan hyödyntää laajasti ICT-sektorilla parantamaan puheliittymien luonnollisuutta.
LyhytotsikkoAproTEAM 2018-2019
TilaPäättynyt
Todellinen alku/loppupvm01/01/201831/12/2019