A system for dynamic 3D visualisation of speech recognition paths

Satumino Luz*, Masood Masoodian, Bill Rogers, Bo Zhang

*Tämän työn vastaava kirjoittaja

Tutkimustuotos: Artikkeli kirjassa/konferenssijulkaisussaChapterScientificvertaisarvioitu

2 Sitaatiot (Scopus)

Abstrakti

This paper presents an interactive visualisation system that assists users of semi-automatic speech transcription systems to assess alternative recognition results in real time and provide feedback to the speech recognition back-end in an intuitive manner. This prototype uses the OpenGL libraries to implement an animated 3D visual representation of alternative recognition results generated by the Sphinx automatic speech recognition system. It is expected that displaying alternatives dynamically will facilitate early detection of recognition errors and encourage user interaction, which in turn can be used to improve future recognition performance.

AlkuperäiskieliEnglanti
OtsikkoAVI '08: Proceedings of the working conference on Advanced visual interfaces
Sivut482-483
Sivumäärä2
ISBN (elektroninen)978-1-60558-141-5
DOI - pysyväislinkit
TilaJulkaistu - 2008
OKM-julkaisutyyppiA3 Kirjan tai muun kokoomateoksen osa
TapahtumaInternational Working Conference on Advanced Visual Interfaces - Naples, Italia
Kesto: 28 toukok. 200830 toukok. 2008

Conference

ConferenceInternational Working Conference on Advanced Visual Interfaces
LyhennettäAVI
Maa/AlueItalia
KaupunkiNaples
Ajanjakso28/05/200830/05/2008

Sormenjälki

Sukella tutkimusaiheisiin 'A system for dynamic 3D visualisation of speech recognition paths'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

Siteeraa tätä