Сравнение 3D-сверточных нейронных сетей с полносвязными и GAP слоями в задаче распознавания действий на видео

Автор(ы): 
Девяткин Д. Д.
Порцев Р. Ю.
Макаренко А. В.
Аннотация: 
В докладе рассмотрены две оригинальные архитектуры глубоких нейронных сетей для решения задачи распознавания действий на видео. Анализируемые сети, в части экстракторов признаков, построены на основе 3D-сверточных слоёв. При этом строение классификаторов у сетей различается: в первом случае применены полносвязные слои, во-втором — GAP-слой. Задача решалась для 20-ти классов, с выраженными паттернами поведения. Использовался датасет Sports-1M. В контексте задачи, изучены вопросы качества и устойчивости функционирования представленных нейронных сетей.
DOI: 
10.25728/ubs.2021.017