Non-parallel voice conversion using i-vector PLDA: Towards unifying speaker verification and transformation

Tomi Kinnunen*, Lauri Juvela, Paavo Alku, Junichi Yamagishi

*Tämän työn vastaava kirjoittaja

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference article in proceedingsScientificvertaisarvioitu

64 Sitaatiot (Scopus)

Abstrakti

Text-independent speaker verification (recognizing speakers regardless of content) and non-parallel voice conversion (transforming voice identities without requiring content-matched training utterances) are related problems. We adopt i-vector method to voice conversion. An i-vector is a fixed-dimensional representation of a speech utterance that enables treating voice conversion in utterance domain, as opposed to frame domain. The high dimensionality (800) and small number of training utterances (24) necessitates using prior information of speakers. We adopt probabilistic linear discriminant analysis (PLDA) for voice conversion. The proposed approach requires neither parallel utterances, transcriptions nor time alignment procedures at any stage.

AlkuperäiskieliEnglanti
Otsikko2017 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2017 - Proceedings
KustantajaIEEE
Sivut5535-5539
Sivumäärä5
ISBN (elektroninen)9781509041176
DOI - pysyväislinkit
TilaJulkaistu - 16 kesäk. 2017
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa
TapahtumaIEEE International Conference on Acoustics, Speech, and Signal Processing - New Orleans, Yhdysvallat
Kesto: 5 maalisk. 20179 maalisk. 2017

Julkaisusarja

NimiProceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing
KustantajaIEEE
ISSN (elektroninen)2379-190X

Conference

ConferenceIEEE International Conference on Acoustics, Speech, and Signal Processing
LyhennettäICASSP
Maa/AlueYhdysvallat
KaupunkiNew Orleans
Ajanjakso05/03/201709/03/2017

Sormenjälki

Sukella tutkimusaiheisiin 'Non-parallel voice conversion using i-vector PLDA: Towards unifying speaker verification and transformation'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä