In-document adaptation for a human guided automatic transcription service

André Mansikkaniemi*, Mikko Kurimo, Krister Lindén

*Tämän työn vastaava kirjoittaja

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaConference contributionScientificvertaisarvioitu

Abstrakti

In this work, the task is to assist human transcribers to produce, for example, interview or parliament speech transcriptions. The system will perform in-document adaptation based on a small amount of manually corrected automatic speech recognition results. The corrected segments of the spoken document are used to adapt the speech recognizer’s acoustic and language model. The updated models are used in second-pass recognition to produce a more accurate automatic transcription for the remaining uncorrected parts of the spoken document. In this work we evaluate two common adaptation methods for speech data in settings that represent typical transcription tasks. For adapting the acoustic model we use the Maximum A Posteriori adaptation method. For adapting the language model we use linear interpolation. We compare results of supervised adaptation to unsupervised adaptation, and evaluate the total benefit of using human corrected segments for in-document adaptation for typical transcription tasks.

AlkuperäiskieliEnglanti
OtsikkoProceedings of the 18th International Conference on Speech and Computer, SPECOM 2016
KustantajaSpringer-Verlag
Sivut395-402
Sivumäärä8
Vuosikerta9811
ISBN (painettu)9783319439570
DOI - pysyväislinkit
TilaJulkaistu - 2016
OKM-julkaisutyyppiA4 Artikkeli konferenssijulkaisuussa
TapahtumaInternational Conference on Speech and Computer - Budapest, Unkari
Kesto: 23 elokuuta 201627 elokuuta 2016
Konferenssinumero: 18
http://www.specom2016.hte.hu/

Julkaisusarja

NimiLecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
Vuosikerta9811
ISSN (painettu)03029743
ISSN (elektroninen)16113349

Conference

ConferenceInternational Conference on Speech and Computer
LyhennettäSPECOM
MaaUnkari
KaupunkiBudapest
Ajanjakso23/08/201627/08/2016
www-osoite

Sormenjälki Sukella tutkimusaiheisiin 'In-document adaptation for a human guided automatic transcription service'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

  • Laitteet

    Science-IT

    Mikko Hakala (Manager)

    Perustieteiden korkeakoulu

    Laitteistot/tilat: Facility

  • Siteeraa tätä

    Mansikkaniemi, A., Kurimo, M., & Lindén, K. (2016). In-document adaptation for a human guided automatic transcription service. teoksessa Proceedings of the 18th International Conference on Speech and Computer, SPECOM 2016 (Vuosikerta 9811, Sivut 395-402). (Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics); Vuosikerta 9811). Springer-Verlag. https://doi.org/10.1007/978-3-319-43958-7_47