Tutkimustuotos

2020

Analysis and classification of phonation types in speech and singing voice

Kadiri, S. R., Alku, P. & Yegnanarayana, B., 2020, julkaisussa : Speech Communication. 118, s. 33-47 15 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Analysis and Detection of Pathological Voice using Glottal Source Features

Kadiri, S. & Alku, P., helmikuuta 2020, julkaisussa : IEEE Journal of Selected Topics in Signal Processing. 14, 2, s. 367-379 8926347.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
44 Lataukset (Pure)

ASVspoof 2019: a large-scale public database of synthetic, converted and replayed speech

Wang, X., Yamagishi, J., Todisco, M., Delgado, H., Nautsch, A., Evans, N., Sahidullah, M., Vestman, V., Kinnunen, T., Aik Lee, K., Juvela, L., Alku, P., Peng, Y-H., Hwang, H-T., Tsao, Y., Wang, H-M., Le Maguer, S., Becker, M., Henderson, F., Clark, R. & 20 muuta, Zhang, Y., Wang, Q., Jia, Y., Onuma, K., Mushika, K., Kaneda, T., Jiang, Y., Liu, L-J., Wu, Y-C., Huang, W-C., Toda, T., Tanaka, K., Kameoka, H., Steiner, I., Matrouf, D., Bonastre, J-F., Govender, A., Ronanki, S., Zhang, J-X. & Ling, Z-H., 2020, (Hyväksytty/In press) julkaisussa : Computer Speech and Language. 64, 101114.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access

Automatic assessment of intelligibility in speakers with dysarthria from coded telephone speech using glottal features

Nonavinakere Prabhakera, N. & Alku, P., tammikuuta 2020, julkaisussa : Computer Speech and Language. 65, 17 Sivumäärä, 101117.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Automatic intelligibility assessment of dysarthric speech using glottal parameters

Nonavinakere Prabhakera, N. & Alku, P., 2020, (Hyväksytty/In press) julkaisussa : Speech Communication.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Comparison of Glottal Closure Instant Detection Algorithms for Emotional Speech

Kadiri, S., Alku, P. & Yegnanarayana, B., 2020, (Hyväksytty/In press) Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing. IEEE, (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Detection of glottal closure instant and glottal open region from speech signals using spectral flatness measure

Kadiri, S., Prasad, R. S. & Yegnanarayana, B., tammikuuta 2020, julkaisussa : Speech Communication. 116, s. 30-43

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

2 Sitaatiot (Scopus)

Detection of Specific Language Impairment in Children Using Glottal Source Features

Reddy, M. K., Alku, P. & Rao, K. S., 2020, julkaisussa : IEEE Access. 8, s. 15273-15279 7 Sivumäärä, 8961993.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
47 Lataukset (Pure)

Determination of glottal closure instants from clean and telephone quality speech signals using single frequency filtering

Kadiri, S. R. & Yegnanarayana, B., marraskuuta 2020, julkaisussa : Computer Speech and Language. 64, 101097.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Excitation Features of Speech for Emotion Recognition Using Neutral Speech as Reference

Kadiri, S., P, G., Gangashetty, S., Alku, P. & Bayya, Y., 2020, julkaisussa : Circuits, Systems, and Signal Processing.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
7 Lataukset (Pure)

Excitation Features of Speech for Speaker-Specific Emotion Detection

Kadiri, S. R. & Alku, P., 1 tammikuuta 2020, julkaisussa : IEEE Access. 8, s. 60382-60391 10 Sivumäärä, 9046041.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
7 Lataukset (Pure)

Glottal Source Information for Pathological Voice Detection

Nonavinakere Prabhakera, N. & Alku, P., 2020, julkaisussa : IEEE Access. 8, s. 67745-67755 11 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
9 Lataukset (Pure)

Listen-and-repeat training improves perception of second language vowel duration: Evidence from mismatch negativity (MMN) and N1 responses and behavioral discrimination

Saloranta, A., Alku, P. & Peltola, M. S., 2020, julkaisussa : International Journal of Psychophysiology. 147, s. 72-82 11 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Motoric Training Alters Speech Sound Perception and Production — Active Listening Training Does Not Lead into Learning Outcomes

Peltola, K., Tamminen, H., Alku, P., Kujala, T. & Peltola, M., 1 tammikuuta 2020, julkaisussa : JOURNAL OF LANGUAGE TEACHING AND RESEARCH. 11, 1, s. 10-16

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access

Neural waveform generation for source-filter vocoding in speech synthesis

Juvela, L., 2020, Aalto University. 180 Sivumäärä

Tutkimustuotos: Doctoral ThesisCollection of Articles

Open access

Spectral Features derived from Single Frequency Filter for Multispeaker Localization

Thakallapalli, S., Kadiri, S. & Gangashetty, S., 2020, National Conference on Communications (NCC) 2020. IEEE, 9056007

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
8 Lataukset (Pure)

Study of Formant Modification for Children ASR

Kathania, H., Kadiri, S., Alku, P. & Kurimo, M., 2020, (Hyväksytty/In press) Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing. IEEE, (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

The Vocal Tract in Loud Twang-Like Singing While Producing High and Low Pitches

Saldías, M., Laukkanen, A. M., Guzmán, M., Miranda, G., Stoney, J., Alku, P. & Sundberg, J., 2020, julkaisussa : Journal of Voice.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Time-varying quasi-closed-phase analysis for accurate formant tracking in speech signals

Gowda, D., Kadiri, S., Story, B. & Alku, P., 2020, (Hyväksytty/In press) julkaisussa : IEEE/ACM Transactions on Audio, Speech, and Language Processing. 14 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

2019

Analysis of Aperiodicity in Artistic Noh Singing Voice using an Impulse Sequence Representation of Excitation Source

Kadiri, S. & Yegnanarayana, B., 1 joulukuuta 2019, julkaisussa : Journal of the Acoustical Society of America. 146, 6, s. 4446-4457

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
2 Lataukset (Pure)

Analysis of phonation onsets in vowel production, using information from glottal area and flow estimate

Murtola, T., Malinen, J., Geneid, A. & Alku, P., 1 toukokuuta 2019, julkaisussa : Speech Communication. 109, s. 55-65 11 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

A Quantitative Comparison of Epoch Extraction Algorithms for Telephone Speech

Kadiri, S. R., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 6500-6504 5 Sivumäärä 8683558. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing; Vuosikerta 2019-May).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
96 Lataukset (Pure)

Augmented CycleGANs for continuous scale normal-to-Lombard speaking style conversion

Seshadri, S., Juvela, L., Alku, P. & Räsänen, O., 2019, Proceedings of Interspeech. International Speech Communication Association, s. 2838-2842 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
43 Lataukset (Pure)

Concept for encoding of information

Bäckström, T., Pedersen, C. F., Fischer, J., Huettenberger, M. & Pino, A., 2019, IPC-nro G10L 19/ 12 A I, Patenttinumero US2019341065, Prioriteetin päiväys 15 heinäkuuta 2019, Prioriteettinumero US201916512156

Tutkimustuotos: PatenttiPatent

Open access

Cycle-consistent adversarial networks for non-parallel vocal effort based speaking style conversion

Seshadri, S., Juvela, L., Yamagishi, J., Räsänen, O. & Alku, P., 1 toukokuuta 2019, ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, s. 6835 - 6839 5 Sivumäärä 8682648. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
106 Lataukset (Pure)

Data augmentation strategies for neural network F0 estimation

Airaksinen, M., Juvela, L., Alku, P. & Räsänen, O., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 6485 - 6489 5 Sivumäärä 8683041. ( IEEE International Conference on Acoustics Speech and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
160 Lataukset (Pure)

Deep Learning for Tube Amplifier Emulation

Damskägg, E-P., Juvela, L., Thuillier, E. & Välimäki, V., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 471-475 5 Sivumäärä 8682805. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
4 Sitaatiot (Scopus)

Dysarthric speech classification from coded telephone speech using glottal features

Nonavinakere Prabhakera, N. & Alku, P., heinäkuuta 2019, julkaisussa : Speech Communication. 110, s. 47-55 15 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

9 Sitaatiot (Scopus)

End-to-End Optimization of Source Models for Speech and Audio Coding Using a Machine Learning Framework

Bäckström, T., syyskuuta 2019, Proceedings of Interspeech. ISCA, s. 3401-3405 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
121 Lataukset (Pure)

Estimation of the glottal source from coded telephone speech using deep neural networks

Narendra, N. P., Airaksinen, M., Story, B. & Alku, P., 1 tammikuuta 2019, julkaisussa : Speech Communication. 106, s. 95-104 10 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

5 Sitaatiot (Scopus)

Gelp: GAN-excited linear prediction for speech synthesis from mel-spectrogram

Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., 1 tammikuuta 2019, Proceedings of Interspeech. International Speech Communication Association, Vuosikerta 2019-September. s. 694-698 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
35 Lataukset (Pure)

GlotNet-A Raw Waveform Model for the Glottal Excitation in Statistical Parametric Speech Synthesis

Juvela, L., Bollepalli, B., Tsiaras, V. & Alku, P., 1 kesäkuuta 2019, julkaisussa : IEEE/ACM Transactions on Audio, Speech, and Language Processing. 27, 6, s. 1019-1030 12 Sivumäärä, 8675543.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
3 Sitaatiot (Scopus)
238 Lataukset (Pure)

Investigating vowel production with computational physical modelling and glottal inverse filtering

Murtola, T., 2019, Aalto University. 187 Sivumäärä

Tutkimustuotos: Doctoral ThesisCollection of Articles

Lombard speech synthesis using transfer learning in a Tacotron text-to-speech system

Bollepalli, B., Juvela, L. & Alku, P., 2019, Proceedings of Interspeech. International Speech Communication Association, s. 2833-2837 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
109 Lataukset (Pure)

Mel-frequency cepstral coefficients derived using the zero-time windowing spectrum for classification of phonation types in singing

Kadiri, S. R. & Alku, P., 8 marraskuuta 2019, julkaisussa : Journal of the Acoustical Society of America. 146, 5, s. EL418-EL423

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
4 Lataukset (Pure)

Mel-frequency cepstral coefficients of voice source waveforms for classification of phonation types in speech

Kadiri, S. R. & Alku, P., 1 tammikuuta 2019, Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH. International Speech Communication Association, Vuosikerta 2019-September. s. 2508-2512 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association, INTERSPEECH).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
48 Lataukset (Pure)

Normal-to-Lombard adaptation of speech synthesis using long short-term memory recurrent neural networks

Bollepalli, B., Juvela, L., Airaksinen, M., Valentini-Botinhao, C. & Alku, P., 1 heinäkuuta 2019, julkaisussa : Speech Communication. 110, s. 64-75 12 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

OPENGLOT – An open environment for the evaluation of glottal inverse filtering

Alku, P., Murtola, T., Malinen, J., Kuortti, J., Story, B., Airaksinen, M., Salmi, M., Vilkman, E. & Geneid, A., 1 helmikuuta 2019, julkaisussa : Speech Communication. 107, s. 38-47 10 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

3 Sitaatiot (Scopus)

Overlap-add Windows with Maximum Energy Concentration for Speech and Audio Processing

Bäckström, T., 1 toukokuuta 2019, 44th IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP 2019; Brighton; United Kingdom; 12-17 May 2019 : Proceedings. IEEE, s. 491-495 5 Sivumäärä 8683577. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
100 Lataukset (Pure)

Real-Time Modeling of Audio Distortion Circuits with Deep Learning

Damskägg, E-P., Juvela, L. & Välimäki, V., 2019, Proceedings of the 16th Sound & Music Computing Conference SMC 2019. s. 332-339 (Proceedings of the Sound and Music Computing Conferences).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
67 Lataukset (Pure)

Robust and Responsive Acoustic Pairing of Devices Using Decorrelating Time-Frequency Modelling

Perez Zarazaga, P., Bäckström, T. & Sigg, S., 2019, European Signal Processing Conference. IEEE, (European Signal Processing Conference).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
48 Lataukset (Pure)

Skewing of the glottal flow with respect to the glottal area measured in natural production of vowels

Alku, P., Murtola, T., Malinen, J., Geneid, A. & Vilkman, E., 16 lokakuuta 2019, julkaisussa : Journal of the Acoustical Society of America. 146, 4, s. 2501-2509 9 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
6 Lataukset (Pure)

Sound Privacy: A Conversational Speech Corpus for Quantifying the Experience of Privacy

Perez Zarazaga, P., Das, S., Bäckström, T., Raju, V. V. V. & Vuppala, A., syyskuuta 2019, Interspeech: Annual Conference of the International Speech Communication Association. International Speech Communication Association, 5 Sivumäärä (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
78 Lataukset (Pure)

Super-Wideband Spectral Envelope Modeling for Speech Coding

Fuchs, G., Ashour, C. & Bäckström, T., syyskuuta 2019, Proceedings of Interspeech. ISCA, s. 3411-3415 (Interspeech - Annual Conference of the International Speech Communication Association).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
84 Lataukset (Pure)

Time Delay Estimation from Mixed Multispeaker Speech Signals Using Single Frequency Filtering

Narayana Murthy, B. H. V. S., Yegnanarayana, B. & Kadiri, S. R., 1 tammikuuta 2019, julkaisussa : Circuits, Systems, and Signal Processing.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
1 Sitaatiot (Scopus)
75 Lataukset (Pure)

Waveform generation for text-to-speech synthesis using pitch-synchronous multi-scale generative adversarial networks

Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., 1 toukokuuta 2019, ICASSP 2019 - 2019 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, s. 6915 - 6919 5 Sivumäärä 8683271. (Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing).

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
118 Lataukset (Pure)

Vocal Effort Based Speaking Style Conversion Using Vocoder Features and Parallel Learning

Seshadri, S., Juvela, L., Räsänen, O. & Alku, P., 1 tammikuuta 2019, julkaisussa : IEEE Access. 7, s. 17230-17246 17 Sivumäärä, 8631106.

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
2 Sitaatiot (Scopus)
147 Lataukset (Pure)

Vocal effort compensation for MFCC feature extraction in a shouted versus normal speaker recognition task

Jokinen, E., Saeidi, R., Kinnunen, T. & Alku, P., 1 tammikuuta 2019, julkaisussa : Computer Speech and Language. 53, s. 1-11 11 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

11 Sitaatiot (Scopus)
2018

A comparison between STRAIGHT, glottal, and sinusoidal vocoding in statistical parametric speech synthesis

Airaksinen, M., Juvela, L., Bollepalli, B., Yamagishi, J. & Alku, P., syyskuuta 2018, julkaisussa : IEEE/ACM Transactions on Audio Speech and Language Processing. 26, 9, s. 1658-1670 13 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Open access
Tiedosto
13 Sitaatiot (Scopus)
113 Lataukset (Pure)

Comparison of spectral tilt measures for sentence prominence in speech — Effects of dimensionality and adverse noise conditions

Kakouros, S., Räsänen, O. & Alku, P., 1 lokakuuta 2018, julkaisussa : Speech Communication. 103, s. 11-26 16 Sivumäärä

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

2 Sitaatiot (Scopus)