Poikkitieteellinen parametrisen puhesynteesin tutkimusprojekti

Tutkimustuotos

2020

Analysis and classification of phonation types in speech and singing voice

Kadiri, S. R., Alku, P. & Yegnanarayana, B., 2020, julkaisussa : Speech Communication. 118, s. 33-47 15 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Analysis and Detection of Pathological Voice using Glottal Source Features

Kadiri, S. & Alku, P., helmikuuta 2020, julkaisussa : IEEE Journal of Selected Topics in Signal Processing. 14, 2, s. 367-379 8926347.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
69 Lataukset (Pure)

Automatic assessment of intelligibility in speakers with dysarthria from coded telephone speech using glottal features

Nonavinakere Prabhakera, N. & Alku, P., tammikuuta 2020, julkaisussa : Computer Speech and Language. 65, 17 Sivumäärä, 101117.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Automatic intelligibility assessment of dysarthric speech using glottal parameters

Nonavinakere Prabhakera, N. & Alku, P., 2020, (Hyväksytty/In press) julkaisussa : Speech Communication. 123, s. 1-9

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Comparison of Glottal Closure Instant Detection Algorithms for Emotional Speech

Kadiri, S., Alku, P. & Yegnanarayana, B., 2020, Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing. IEEE, s. 7379-7383 5 Sivumäärä 9054737. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto

Detection of glottal closure instant and glottal open region from speech signals using spectral flatness measure

Kadiri, S., Prasad, R. S. & Yegnanarayana, B., tammikuuta 2020, julkaisussa : Speech Communication. 116, s. 30-43

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

2 Sitaatiot (Scopus)

Detection of Specific Language Impairment in Children Using Glottal Source Features

Reddy, M. K., Alku, P. & Rao, K. S., 2020, julkaisussa : IEEE Access. 8, s. 15273-15279 7 Sivumäärä, 8961993.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
61 Lataukset (Pure)

Determination of glottal closure instants from clean and telephone quality speech signals using single frequency filtering

Kadiri, S. R. & Yegnanarayana, B., marraskuuta 2020, julkaisussa : Computer Speech and Language. 64, 101097.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Excitation Features of Speech for Emotion Recognition Using Neutral Speech as Reference

Kadiri, S., P, G., Gangashetty, S., Alku, P. & Bayya, Y., 2020, julkaisussa : Circuits, Systems, and Signal Processing.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
15 Lataukset (Pure)

Excitation Features of Speech for Speaker-Specific Emotion Detection

Kadiri, S. R. & Alku, P., 1 tammikuuta 2020, julkaisussa : IEEE Access. 8, s. 60382-60391 10 Sivumäärä, 9046041.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
15 Lataukset (Pure)

Glottal Source Information for Pathological Voice Detection

Nonavinakere Prabhakera, N. & Alku, P., 2020, julkaisussa : IEEE Access. 8, s. 67745-67755 11 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
18 Lataukset (Pure)

Indicators of anterior–posterior phase difference in glottal opening measured from natural production of vowels

Murtola, T. & Alku, P., 1 elokuuta 2020, julkaisussa : Journal of the Acoustical Society of America. 148, 2, s. EL141-EL146 5 Sivumäärä

Tutkimustuotos: LehtiartikkeliLetterScientificvertaisarvioitu

Open access

Mel-weighted Single Frequency Filtering Spectrogram for Dialect Identification

Kethireddy, R., Kadiri, S., Alku, P. & Gangashetty, S. V., 2020, julkaisussa : IEEE Access.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access

Spectral Features derived from Single Frequency Filter for Multispeaker Localization

Thakallapalli, S., Kadiri, S. & Gangashetty, S., 2020, National Conference on Communications (NCC) 2020. IEEE, 9056007

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
29 Lataukset (Pure)

Time-varying quasi-closed-phase analysis for accurate formant tracking in speech signals

Gowda, D., Kadiri, S., Story, B. & Alku, P., 4 kesäkuuta 2020, julkaisussa : IEEE/ACM Transactions on Audio, Speech, and Language Processing. 28, s. 1901-1914 14 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
9 Lataukset (Pure)
2019

Analysis of Aperiodicity in Artistic Noh Singing Voice using an Impulse Sequence Representation of Excitation Source

Kadiri, S. & Yegnanarayana, B., 1 joulukuuta 2019, julkaisussa : Journal of the Acoustical Society of America. 146, 6, s. 4446-4457

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
8 Lataukset (Pure)

Analysis of phonation onsets in vowel production, using information from glottal area and flow estimate

Murtola, T., Malinen, J., Geneid, A. & Alku, P., 1 toukokuuta 2019, julkaisussa : Speech Communication. 109, s. 55-65 11 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

A Quantitative Comparison of Epoch Extraction Algorithms for Telephone Speech

Kadiri, S. R., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 6500-6504 5 Sivumäärä 8683558. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing; Vuosikerta 2019-May).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
4 Sitaatiot (Scopus)
113 Lataukset (Pure)

Augmented CycleGANs for continuous scale normal-to-Lombard speaking style conversion

Seshadri, S., Juvela, L., Alku, P. & Räsänen, O., 2019, Proceedings of Interspeech. International Speech Communication Association, s. 2838-2842 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
3 Sitaatiot (Scopus)
51 Lataukset (Pure)

Cycle-consistent adversarial networks for non-parallel vocal effort based speaking style conversion

Seshadri, S., Juvela, L., Yamagishi, J., Räsänen, O. & Alku, P., 1 toukokuuta 2019, ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, s. 6835 - 6839 5 Sivumäärä 8682648. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
4 Sitaatiot (Scopus)
116 Lataukset (Pure)

Data augmentation strategies for neural network F0 estimation

Airaksinen, M., Juvela, L., Alku, P. & Räsänen, O., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 6485 - 6489 5 Sivumäärä 8683041. ( IEEE International Conference on Acoustics Speech and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
170 Lataukset (Pure)

Dysarthric speech classification from coded telephone speech using glottal features

Nonavinakere Prabhakera, N. & Alku, P., heinäkuuta 2019, julkaisussa : Speech Communication. 110, s. 47-55 15 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

9 Sitaatiot (Scopus)

End-to-End Optimization of Source Models for Speech and Audio Coding Using a Machine Learning Framework

Bäckström, T., syyskuuta 2019, Proceedings of Interspeech. ISCA, s. 3401-3405 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
132 Lataukset (Pure)

Estimation of the glottal source from coded telephone speech using deep neural networks

Narendra, N. P., Airaksinen, M., Story, B. & Alku, P., 1 tammikuuta 2019, julkaisussa : Speech Communication. 106, s. 95-104 10 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

5 Sitaatiot (Scopus)

Gelp: GAN-excited linear prediction for speech synthesis from mel-spectrogram

Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., 1 tammikuuta 2019, Proceedings of Interspeech. International Speech Communication Association, Vuosikerta 2019-September. s. 694-698 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
3 Sitaatiot (Scopus)
53 Lataukset (Pure)

GlotNet-A Raw Waveform Model for the Glottal Excitation in Statistical Parametric Speech Synthesis

Juvela, L., Bollepalli, B., Tsiaras, V. & Alku, P., 1 kesäkuuta 2019, julkaisussa : IEEE/ACM Transactions on Audio, Speech, and Language Processing. 27, 6, s. 1019-1030 12 Sivumäärä, 8675543.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
5 Sitaatiot (Scopus)
259 Lataukset (Pure)

Lombard speech synthesis using transfer learning in a Tacotron text-to-speech system

Bollepalli, B., Juvela, L. & Alku, P., 2019, Proceedings of Interspeech. International Speech Communication Association, s. 2833-2837 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
182 Lataukset (Pure)

Mel-frequency cepstral coefficients derived using the zero-time windowing spectrum for classification of phonation types in singing

Kadiri, S. R. & Alku, P., 8 marraskuuta 2019, julkaisussa : Journal of the Acoustical Society of America. 146, 5, s. EL418-EL423

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
14 Lataukset (Pure)

Mel-frequency cepstral coefficients of voice source waveforms for classification of phonation types in speech

Kadiri, S. R. & Alku, P., 1 tammikuuta 2019, Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. International Speech Communication Association, Vuosikerta 2019-September. s. 2508-2512 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association, INTERSPEECH).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
56 Lataukset (Pure)

OPENGLOT – An open environment for the evaluation of glottal inverse filtering

Alku, P., Murtola, T., Malinen, J., Kuortti, J., Story, B., Airaksinen, M., Salmi, M., Vilkman, E. & Geneid, A., 1 helmikuuta 2019, julkaisussa : Speech Communication. 107, s. 38-47 10 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

5 Sitaatiot (Scopus)

Overlap-add Windows with Maximum Energy Concentration for Speech and Audio Processing

Bäckström, T., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 491-495 5 Sivumäärä 8683577. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
119 Lataukset (Pure)

Robust and Responsive Acoustic Pairing of Devices Using Decorrelating Time-Frequency Modelling

Perez Zarazaga, P., Bäckström, T. & Sigg, S., 2019, European Signal Processing Conference. IEEE, (European Signal Processing Conference).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
58 Lataukset (Pure)

Skewing of the glottal flow with respect to the glottal area measured in natural production of vowels

Alku, P., Murtola, T., Malinen, J., Geneid, A. & Vilkman, E., 16 lokakuuta 2019, julkaisussa : Journal of the Acoustical Society of America. 146, 4, s. 2501-2509 9 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
15 Lataukset (Pure)

Time Delay Estimation from Mixed Multispeaker Speech Signals Using Single Frequency Filtering

Narayana Murthy, B. H. V. S., Yegnanarayana, B. & Kadiri, S. R., 1 tammikuuta 2019, julkaisussa : Circuits, Systems, and Signal Processing.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
82 Lataukset (Pure)

Waveform generation for text-to-speech synthesis using pitch-synchronous multi-scale generative adversarial networks

Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., 1 toukokuuta 2019, ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, s. 6915 - 6919 5 Sivumäärä 8683271. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
124 Lataukset (Pure)

Vocal effort compensation for MFCC feature extraction in a shouted versus normal speaker recognition task

Jokinen, E., Saeidi, R., Kinnunen, T. & Alku, P., 1 tammikuuta 2019, julkaisussa : Computer Speech and Language. 53, s. 1-11 11 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
14 Sitaatiot (Scopus)
18 Lataukset (Pure)
2018

A comparison between STRAIGHT, glottal, and sinusoidal vocoding in statistical parametric speech synthesis

Airaksinen, M., Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., syyskuuta 2018, julkaisussa : IEEE/ACM Transactions on Audio Speech and Language Processing. 26, 9, s. 1658-1670 13 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
14 Sitaatiot (Scopus)
134 Lataukset (Pure)

Comparison of spectral tilt measures for sentence prominence in speech — Effects of dimensionality and adverse noise conditions

Kakouros, S., Räsänen, O. & Alku, P., 1 lokakuuta 2018, julkaisussa : Speech Communication. 103, s. 11-26 16 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
13 Lataukset (Pure)

Dysarthric speech classification using glottal features computed from non-words, words and sentences

Nonavinakere Prabhakera, N. & Alku, P., 2 syyskuuta 2018, Proceedings of Interspeech. International Speech Communication Association, s. 3403-3407 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
6 Sitaatiot (Scopus)
225 Lataukset (Pure)

Interaction mechanisms between glottal source and vocal tract in pitch glides

Murtola, T. & Malinen, J., 1 tammikuuta 2018, Proceedings of Interspeech. International Speech Communication Association, Vuosikerta 2018-September. s. 2987-2991 5 Sivumäärä (Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
107 Lataukset (Pure)

Is infant-directed speech interesting because it is surprising? – Linking properties of IDS to statistical learning and attention at the prosodic level

Räsänen, O., Kakouros, S. & Soderstrom, M., 1 syyskuuta 2018, julkaisussa : Cognition. 178, s. 193-206 14 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
85 Lataukset (Pure)

Noise reduction for randomized speech and audio coding in WASNs

Fischer, J. & Bäckström, T., 2018. 5 Sivumäärä.

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaKonferenssiesitysScientificvertaisarvioitu

Tiedosto
19 Lataukset (Pure)

Optimizing MFCC Settings for Low-Complexity VAD Systems - a Case Study

Craciun, A. & Bäckström, T., 2018, ITG-Fb. 282: Speech Communication. VDE Verlag, s. 281-285

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
23 Lataukset (Pure)

Postfiltering with Complex Spectral Correlations for Speech and Audio Coding

Das, S. & Bäckström, T., syyskuuta 2018, Interspeech: Annual Conference of the International Speech Communication Association. International Speech Communication Association, s. 3538-3542 5 Sivumäärä 1026. (Interspeech).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
167 Lataukset (Pure)

Speaker-independent raw waveform model for glottal excitation

Juvela, L., Tsiaras, V., Bollepalli, B., Airaksinen, M., Yamagishi, J. & Alku, P., 2 syyskuuta 2018, Proceedings of Interspeech. International Speech Communication Association, s. 2012-2016 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
16 Sitaatiot (Scopus)
121 Lataukset (Pure)

Speech Coding, Speech Interfaces and IoT - Opportunities and Challenges

Bäckström, T., 2018, 2018 52nd Asilomar Conference on Signals, Systems, and Computers. IEEE, s. 1931 - 1935 (Conference Record of the Asilomar Conference on Signals Systems and Computers).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientific

Open access
Tiedosto
109 Lataukset (Pure)

Speech Waveform Synthesis from MFCC Sequences with Generative Adversarial Networks

Juvela, L., Bollepalli, B., Wang, X., Kameoka, H., Airaksinen, M., Yamagishi, J. & Alku, P., 10 syyskuuta 2018, 2018 IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2018 - Proceedings. United States: IEEE, Vuosikerta 2018-April. s. 5679-5683 5 Sivumäärä 8461852. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
17 Sitaatiot (Scopus)
151 Lataukset (Pure)

Time-regularized linear prediction for noise-robust extraction of the spectral envelope of speech

Airaksinen, M., Juvela, L., Räsänen, O. & Alku, P., 2 syyskuuta 2018, Proceedings of Interspeech. International Speech Communication Association, s. 701-705 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
144 Lataukset (Pure)