Projekteja vuodessa
Abstrakti
Speaking style conversion (SSC) is the technology of converting natural speech signals from one style to another. In this study, we propose the use of cycle-consistent adversarial networks (CycleGANs) for converting styles with varying vocal effort, and focus on conversion between normal and Lombard styles as a case study of this problem. We propose a parametric approach that uses the Pulse Model in Log domain (PML) vocoder to extract speech features. These features are mapped using the CycleGAN from utterances in the source style to the corresponding features of target speech. Finally, the mapped features are converted to a Lombard speech waveform with the PML. The CycleGAN was compared in subjective listening tests with 2 other standard mapping methods used in conversion, and the CycleGAN was found to have the best performance in terms of speech quality and in terms of the magnitude of the perceptual change between the two styles.
Alkuperäiskieli | Englanti |
---|---|
Otsikko | ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) |
Kustantaja | IEEE |
Sivut | 6835 - 6839 |
Sivumäärä | 5 |
ISBN (elektroninen) | 978-1-4799-8131-1 |
ISBN (painettu) | 978-1-4799-8132-8 |
DOI - pysyväislinkit | |
Tila | Julkaistu - 1 toukok. 2019 |
OKM-julkaisutyyppi | A4 Artikkeli konferenssijulkaisussa |
Tapahtuma | IEEE International Conference on Acoustics, Speech, and Signal Processing - Brighton, Iso-Britannia Kesto: 12 toukok. 2019 → 17 toukok. 2019 Konferenssinumero: 44 |
Julkaisusarja
Nimi | Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing |
---|---|
ISSN (painettu) | 1520-6149 |
ISSN (elektroninen) | 2379-190X |
Conference
Conference | IEEE International Conference on Acoustics, Speech, and Signal Processing |
---|---|
Lyhennettä | ICASSP |
Maa/Alue | Iso-Britannia |
Kaupunki | Brighton |
Ajanjakso | 12/05/2019 → 17/05/2019 |
Sormenjälki
Sukella tutkimusaiheisiin 'Cycle-consistent adversarial networks for non-parallel vocal effort based speaking style conversion'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.Projektit
- 3 Päättynyt
-
Poikkitieteellinen parametrisen puhesynteesin tutkimusprojekti
Alku, P. (Vastuullinen tutkija), Bäckström, T. (Projektin jäsen), Juvela, L. (Projektin jäsen), Murtola, T. (Projektin jäsen), Nonavinakere Prabhakera, N. (Projektin jäsen), Bollepalli, B. (Projektin jäsen) & Airaksinen, M. (Projektin jäsen)
01/01/2018 → 31/12/2019
Projekti: Academy of Finland: Other research funding
-
-: Ihmisen ja koneen kielenoppimisen kontekstisidonnainen laskennallinen perusta
Räsänen, O.
31/12/2017 → 31/08/2023
Projekti: Academy of Finland: Other research funding
-
ACLEW: Lasten kielikokemuksien kartoitus ja analyysi koko maailman mittakaavassa
Räsänen, O. (Vastuullinen tutkija) & Seshadri, S. (Projektin jäsen)
01/06/2017 → 31/05/2020
Projekti: Academy of Finland: Other research funding