Projekteja vuodessa
Abstrakti
Recent models for the temporal action proposal task show that local properties can be an alternative to the region proposal network (RPN) for generating good proposal candidates on untrimmed videos. In this study, we devise an RPN model with a new two-stage pipeline and a new joint scoring function for temporal proposals. The evaluation of local properties is integrated into our RPN model to search for the best proposal candidates that can be distinguished mainly in fine details of proposal regions. Our network models proposals in multiple scales using two recurrent neural network layers with attention mechanisms. We observe that joint training of the RPN with local clues and multi-scale modeling of proposals with recurrent attention mechanisms improve the performance of the proposal generation task. Our model yields state-of-the-art results on the THUMOS-14 and comparable results on the ActivityNet-1.3 datasets.
Alkuperäiskieli | Englanti |
---|---|
Artikkeli | 103709 |
Sivut | 1-13 |
Sivumäärä | 13 |
Julkaisu | JOURNAL OF VISUAL COMMUNICATION AND IMAGE REPRESENTATION |
Vuosikerta | 90 |
DOI - pysyväislinkit | |
Tila | Julkaistu - helmik. 2023 |
OKM-julkaisutyyppi | A1 Julkaistu artikkeli, soviteltu |
Sormenjälki
Sukella tutkimusaiheisiin 'Improved action proposals using fine-grained proposal features with recurrent attention models'. Ne muodostavat yhdessä ainutlaatuisen sormenjäljen.-
Tarkeempi puheen ja videokuvan tunnistus silmät ja korvat auki
Laaksonen, J., Wang, T., Guo, Z. & Pehlivan Tort, S.
01/01/2022 → 31/12/2024
Projekti: Academy of Finland: Other research funding
-
Elokuvien muovaama Suomi: suomalainen näytelmäelokuva audiovisuaalisena big datana 1907-2017
Laaksonen, J., Pehlivan Tort, S. & Wang, T.
01/01/2020 → 31/12/2022
Projekti: Academy of Finland: Other research funding