首页 | 本学科首页   官方微博 | 高级检索  
   检索      

利用多时间尺度卷积的视频行为识别网络
引用本文:陈西江,梁全恩,韩贤权,安庆.利用多时间尺度卷积的视频行为识别网络[J].国防科技大学学报,2023,45(3):136-145.
作者姓名:陈西江  梁全恩  韩贤权  安庆
作者单位:武汉理工大学 安全科学与应急管理学院, 湖北 武汉 430070;长江科学院, 湖北 武汉 430010;武昌理工学院 人工智能学院, 湖北 武汉 430223
基金项目:国家自然科学基金资助项目(42171428);重庆市技术创新与应用发展专项面上资助项目(cstc2019jscx-msxmX0051);长江科学院开放研究基金资助项目(CKWV2019758/KY)
摘    要:基于2D的行为识别网络通常融合多张视频帧的分类结果识别不同的行为,但其在卷积过程中缺少对时空特征提取。针对该问题,基于时间位移模块(temporal shift module,TSM)的思想设计了一组多时间尺度卷积,包含不同设计的卷积核以提取融合不同时间尺度的时空信息。通过控制多时间尺度卷积嵌入ResNet50网络的位置及其模块的参数设置,寻找最优的基于多时间尺度卷积的行为识别网络。使用PyTorch深度学习框架训练模型,在大型开源数据集Something-Somethingv2上进行了实验研究。结果表明,基于多时间尺度卷积的行为识别网络对行为识别准确率达到了59.47%,优于TSM等网络。

关 键 词:行为识别  卷积神经网络  分类  残差神经网络  PyTorch
收稿时间:2021/6/1 0:00:00

Video behavior recognition network using multi time-scale convolution
CHEN Xijiang,LIANG Quanen,HAN Xianquan,AN Qing.Video behavior recognition network using multi time-scale convolution[J].Journal of National University of Defense Technology,2023,45(3):136-145.
Authors:CHEN Xijiang  LIANG Quanen  HAN Xianquan  AN Qing
Institution:School of Safety Science and Emergency Management, Wuhan University of Technology, Wuhan 430070, China;Changjiang River Scientific Research Institute, Wuhan 430010, China; School of Artificial Intelligence, Wuchang University of Technology, Wuhan 430223, China
Abstract:
Keywords:behavior recognition  convolution neural network  classification  residual neural network  PyTorch
点击此处可从《国防科技大学学报》浏览原始摘要信息
点击此处可从《国防科技大学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号