Projekteja vuodessa
Abstrakti
This paper proposes a method for generating speech from filterbank mel frequency cepstral coefficients (MFCC), which are widely used in speech applications, such as ASR, but are generally considered unusable for speech synthesis. First, we predict fundamental frequency and voicing information from MFCCs with an autoregressive recurrent neural net. Second, the spectral envelope information contained in MFCCs is converted to all-pole filters, and a pitch-synchronous excitation model matched to these filters is trained. Finally, we introduce a generative adversarial network-based noise model to add a realistic high-frequency stochastic component to the modeled excitation signal. The results show that high quality speech reconstruction can be obtained, given only MFCC information at test time.
Alkuperäiskieli | Englanti |
---|---|
Otsikko | 2018 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2018 - Proceedings |
Julkaisupaikka | United States |
Kustantaja | IEEE |
Sivut | 5679-5683 |
Sivumäärä | 5 |
Vuosikerta | 2018-April |
ISBN (elektroninen) | 978-1-5386-4658-8 |
ISBN (painettu) | 978-1-5386-4659-5 |
DOI - pysyväislinkit | |
Tila | Julkaistu - 10 syysk. 2018 |
OKM-julkaisutyyppi | A4 Artikkeli konferenssijulkaisussa |
Tapahtuma | IEEE International Conference on Acoustics, Speech, and Signal Processing - Calgary, Kanada Kesto: 15 huhtik. 2018 → 20 huhtik. 2018 https://2018.ieeeicassp.org/ |
Julkaisusarja
Nimi | Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing |
---|---|
ISSN (elektroninen) | 2379-190X |
Conference
Conference | IEEE International Conference on Acoustics, Speech, and Signal Processing |
---|---|
Lyhennettä | ICASSP |
Maa/Alue | Kanada |
Kaupunki | Calgary |
Ajanjakso | 15/04/2018 → 20/04/2018 |
www-osoite |
Sormenjälki
Sukella tutkimusaiheisiin 'Speech Waveform Synthesis from MFCC Sequences with Generative Adversarial Networks'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.Projektit
- 2 Päättynyt
-
Poikkitieteellinen parametrisen puhesynteesin tutkimusprojekti
Alku, P. (Vastuullinen tutkija), Bäckström, T. (Projektin jäsen), Juvela, L. (Projektin jäsen), Murtola, T. (Projektin jäsen), Nonavinakere Prabhakera, N. (Projektin jäsen), Bollepalli, B. (Projektin jäsen) & Airaksinen, M. (Projektin jäsen)
01/01/2018 → 31/12/2019
Projekti: Academy of Finland: Other research funding
-
Poikkitieteellinen parametrisen puhesynteesin tutkimusprojekti
Juvela, L. (Projektin jäsen), Bäckström, T. (Projektin jäsen), Pohjalainen, J. (Projektin jäsen), Gowda, D. (Projektin jäsen), Jokinen, E. (Projektin jäsen), Alku, P. (Vastuullinen tutkija), Bollepalli, B. (Projektin jäsen), Saeidi, R. (Projektin jäsen), Raitio, T. (Projektin jäsen), Kakouros, S. (Projektin jäsen) & Airaksinen, M. (Projektin jäsen)
01/01/2015 → 31/12/2017
Projekti: Academy of Finland: Other research funding