Poikkitieteellinen parametrisen puhesynteesin tutkimusprojekti

Tutkimustuotos

Suodatin
Conference contribution
2020

Comparison of Glottal Closure Instant Detection Algorithms for Emotional Speech

Kadiri, S., Alku, P. & Yegnanarayana, B., 2020, (Hyväksytty/In press) Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing. IEEE, (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Spectral Features derived from Single Frequency Filter for Multispeaker Localization

Thakallapalli, S., Kadiri, S. & Gangashetty, S., 2020, National Conference on Communications (NCC) 2020. IEEE, 9056007

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
29 Lataukset (Pure)
2019

A Quantitative Comparison of Epoch Extraction Algorithms for Telephone Speech

Kadiri, S. R., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 6500-6504 5 Sivumäärä 8683558. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing; Vuosikerta 2019-May).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
113 Lataukset (Pure)

Augmented CycleGANs for continuous scale normal-to-Lombard speaking style conversion

Seshadri, S., Juvela, L., Alku, P. & Räsänen, O., 2019, Proceedings of Interspeech. International Speech Communication Association, s. 2838-2842 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
3 Sitaatiot (Scopus)
51 Lataukset (Pure)

Cycle-consistent adversarial networks for non-parallel vocal effort based speaking style conversion

Seshadri, S., Juvela, L., Yamagishi, J., Räsänen, O. & Alku, P., 1 toukokuuta 2019, ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, s. 6835 - 6839 5 Sivumäärä 8682648. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
4 Sitaatiot (Scopus)
116 Lataukset (Pure)

Data augmentation strategies for neural network F0 estimation

Airaksinen, M., Juvela, L., Alku, P. & Räsänen, O., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 6485 - 6489 5 Sivumäärä 8683041. ( IEEE International Conference on Acoustics Speech and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
170 Lataukset (Pure)

End-to-End Optimization of Source Models for Speech and Audio Coding Using a Machine Learning Framework

Bäckström, T., syyskuuta 2019, Proceedings of Interspeech. ISCA, s. 3401-3405 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
132 Lataukset (Pure)

Gelp: GAN-excited linear prediction for speech synthesis from mel-spectrogram

Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., 1 tammikuuta 2019, Proceedings of Interspeech. International Speech Communication Association, Vuosikerta 2019-September. s. 694-698 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
3 Sitaatiot (Scopus)
52 Lataukset (Pure)

Lombard speech synthesis using transfer learning in a Tacotron text-to-speech system

Bollepalli, B., Juvela, L. & Alku, P., 2019, Proceedings of Interspeech. International Speech Communication Association, s. 2833-2837 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
181 Lataukset (Pure)

Mel-frequency cepstral coefficients of voice source waveforms for classification of phonation types in speech

Kadiri, S. R. & Alku, P., 1 tammikuuta 2019, Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. International Speech Communication Association, Vuosikerta 2019-September. s. 2508-2512 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association, INTERSPEECH).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
56 Lataukset (Pure)

Overlap-add Windows with Maximum Energy Concentration for Speech and Audio Processing

Bäckström, T., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 491-495 5 Sivumäärä 8683577. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
119 Lataukset (Pure)

Robust and Responsive Acoustic Pairing of Devices Using Decorrelating Time-Frequency Modelling

Perez Zarazaga, P., Bäckström, T. & Sigg, S., 2019, European Signal Processing Conference. IEEE, (European Signal Processing Conference).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
56 Lataukset (Pure)

Waveform generation for text-to-speech synthesis using pitch-synchronous multi-scale generative adversarial networks

Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., 1 toukokuuta 2019, ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, s. 6915 - 6919 5 Sivumäärä 8683271. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
124 Lataukset (Pure)
2018

Dysarthric speech classification using glottal features computed from non-words, words and sentences

Nonavinakere Prabhakera, N. & Alku, P., 2 syyskuuta 2018, Proceedings of Interspeech. International Speech Communication Association, s. 3403-3407 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
6 Sitaatiot (Scopus)
223 Lataukset (Pure)

Interaction mechanisms between glottal source and vocal tract in pitch glides

Murtola, T. & Malinen, J., 1 tammikuuta 2018, Proceedings of Interspeech. International Speech Communication Association, Vuosikerta 2018-September. s. 2987-2991 5 Sivumäärä (Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
107 Lataukset (Pure)

Optimizing MFCC Settings for Low-Complexity VAD Systems - a Case Study

Craciun, A. & Bäckström, T., 2018, ITG-Fb. 282: Speech Communication. VDE Verlag, s. 281-285

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
23 Lataukset (Pure)

Postfiltering with Complex Spectral Correlations for Speech and Audio Coding

Das, S. & Bäckström, T., syyskuuta 2018, Interspeech: Annual Conference of the International Speech Communication Association. International Speech Communication Association, s. 3538-3542 5 Sivumäärä 1026. (Interspeech).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
166 Lataukset (Pure)

Speaker-independent raw waveform model for glottal excitation

Juvela, L., Tsiaras, V., Bollepalli, B., Airaksinen, M., Yamagishi, J. & Alku, P., 2 syyskuuta 2018, Proceedings of Interspeech. International Speech Communication Association, s. 2012-2016 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
16 Sitaatiot (Scopus)
121 Lataukset (Pure)

Speech Coding, Speech Interfaces and IoT - Opportunities and Challenges

Bäckström, T., 2018, 2018 52nd Asilomar Conference on Signals, Systems, and Computers. IEEE, s. 1931 - 1935 (Conference Record of the Asilomar Conference on Signals Systems and Computers).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientific

Open access
Tiedosto
109 Lataukset (Pure)

Speech Waveform Synthesis from MFCC Sequences with Generative Adversarial Networks

Juvela, L., Bollepalli, B., Wang, X., Kameoka, H., Airaksinen, M., Yamagishi, J. & Alku, P., 10 syyskuuta 2018, 2018 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2018 - Proceedings. United States: IEEE, Vuosikerta 2018-April. s. 5679-5683 5 Sivumäärä 8461852. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
17 Sitaatiot (Scopus)
149 Lataukset (Pure)

Time-regularized linear prediction for noise-robust extraction of the spectral envelope of speech

Airaksinen, M., Juvela, L., Räsänen, O. & Alku, P., 2 syyskuuta 2018, Proceedings of Interspeech. International Speech Communication Association, s. 701-705 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
144 Lataukset (Pure)