利用多时间尺度卷积的视频行为识别网络 Video behavior recognition network using multi time-scale convolution期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

利用多时间尺度卷积的视频行为识别网络

引用本文：	陈西江,梁全恩,韩贤权,安庆.利用多时间尺度卷积的视频行为识别网络[J].国防科技大学学报,2023,45(3):136-145.

作者姓名：	陈西江梁全恩韩贤权安庆

作者单位：	武汉理工大学安全科学与应急管理学院, 湖北武汉 430070;长江科学院, 湖北武汉 430010;武昌理工学院人工智能学院, 湖北武汉 430223

基金项目：	国家自然科学基金资助项目(42171428)；重庆市技术创新与应用发展专项面上资助项目(cstc2019jscx-msxmX0051)；长江科学院开放研究基金资助项目(CKWV2019758/KY)

摘要：	基于2D的行为识别网络通常融合多张视频帧的分类结果识别不同的行为,但其在卷积过程中缺少对时空特征提取。针对该问题,基于时间位移模块(temporal shift module,TSM)的思想设计了一组多时间尺度卷积,包含不同设计的卷积核以提取融合不同时间尺度的时空信息。通过控制多时间尺度卷积嵌入ResNet50网络的位置及其模块的参数设置,寻找最优的基于多时间尺度卷积的行为识别网络。使用PyTorch深度学习框架训练模型,在大型开源数据集Something-Somethingv2上进行了实验研究。结果表明,基于多时间尺度卷积的行为识别网络对行为识别准确率达到了59.47%,优于TSM等网络。
关键词：	行为识别卷积神经网络分类残差神经网络 PyTorch
收稿时间：	2021/6/1 0:00:00
Video behavior recognition network using multi time-scale convolution

CHEN Xijiang,LIANG Quanen,HAN Xianquan,AN Qing.Video behavior recognition network using multi time-scale convolution[J].Journal of National University of Defense Technology,2023,45(3):136-145.

Authors:	CHEN Xijiang LIANG Quanen HAN Xianquan AN Qing

Institution:	School of Safety Science and Emergency Management, Wuhan University of Technology, Wuhan 430070, China;Changjiang River Scientific Research Institute, Wuhan 430010, China; School of Artificial Intelligence, Wuchang University of Technology, Wuhan 430223, China

Abstract:

Keywords:	behavior recognition convolution neural network classification residual neural network PyTorch

	点击此处可从《国防科技大学学报》浏览原始摘要信息
	点击此处可从《国防科技大学学报》下载免费的PDF全文

设为首页 | 免责声明 | 关于勤云 | 加入收藏