Image and Video Captioning with Augmented Neural Architectures

Tutkimustuotos: LehtiartikkeliArticleScientificvertaisarvioitu

Abstrakti

Neural-network-based image and video captioning can be substantially improved by utilizing architectures that make use of special features from the scene context, objects, and locations. A novel discriminatively trained evaluator network for choosing the best caption among those generated by an ensemble of caption generator networks further improves accuracy.
AlkuperäiskieliEnglanti
Sivut34-46
Sivumäärä13
JulkaisuIEEE Multimedia
Vuosikerta25
Numero2
DOI - pysyväislinkit
TilaJulkaistu - 2018
OKM-julkaisutyyppiA1 Julkaistu artikkeli, soviteltu

Sormenjälki Sukella tutkimusaiheisiin 'Image and Video Captioning with Augmented Neural Architectures'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.

  • Laitteet

    Science-IT

    Mikko Hakala (Manager)

    Perustieteiden korkeakoulu

    Laitteistot/tilat: Facility

  • Siteeraa tätä