GMM-Based Iterative Entropy Coding for Spectral Envelopes of Speech and Audio

Srikanth Korse, Guillaume Fuchs, Tom Bäckström

    Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference article in proceedingsScientificvertaisarvioitu

    5 Sitaatiot (Scopus)
    292 Lataukset (Pure)

    Abstrakti

    Spectral envelope modelling is a central part of speech and audio codecs and is traditionally based on either vector quantization or scalar quantization followed by entropy coding. To bridge the coding performance of vector quantization with the low complexity of the scalar case, we propose an iterative approach for entropy coding the spectral envelope parameters. For each parameter, a univariate probability distribution is derived from a Gaussian mixture model of the joint distribution and the previously quantized parameters used as a-priori information. Parameters are then iteratively and individually scalar quantized and entropy coded. Unlike vector quantization, the complexity of proposed method does not increase exponentially with dimension and bitrate. Moreover, the coding resolution and dimension can be adaptively modified without retraining the model. Experimental results show that these important advantages do not impair coding efficiency compared to a state-of-art vector quantization scheme.
    AlkuperäiskieliEnglanti
    OtsikkoProceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    KustantajaIEEE
    Sivut5689-5693
    ISBN (elektroninen)978-1-5386-4658-8
    DOI - pysyväislinkit
    TilaJulkaistu - 2018
    OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisussa
    TapahtumaIEEE International Conference on Acoustics, Speech, and Signal Processing - Calgary, Kanada
    Kesto: 15 huhtik. 201820 huhtik. 2018
    https://2018.ieeeicassp.org/

    Julkaisusarja

    NimiProceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing
    ISSN (elektroninen)2379-190X

    Conference

    ConferenceIEEE International Conference on Acoustics, Speech, and Signal Processing
    LyhennettäICASSP
    Maa/AlueKanada
    KaupunkiCalgary
    Ajanjakso15/04/201820/04/2018
    www-osoite

    Sormenjälki

    Sukella tutkimusaiheisiin 'GMM-Based Iterative Entropy Coding for Spectral Envelopes of Speech and Audio'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.
    • Poikkitieteellinen parametrisen puhesynteesin tutkimusprojekti

      Juvela, L. (Projektin jäsen), Bäckström, T. (Projektin jäsen), Pohjalainen, J. (Projektin jäsen), Gowda, D. (Projektin jäsen), Jokinen, E. (Projektin jäsen), Alku, P. (Vastuullinen tutkija), Bollepalli, B. (Projektin jäsen), Saeidi, R. (Projektin jäsen), Raitio, T. (Projektin jäsen), Kakouros, S. (Projektin jäsen) & Airaksinen, M. (Projektin jäsen)

      01/01/201531/12/2017

      Projekti: Academy of Finland: Other research funding

    Siteeraa tätä