基于多核扩展卷积的无监督视频行人重识别|||北京沫之东生物技术有限公司

2 次围观

行人重识别旨在跨监控摄像头下检索出特定的行人目标。由于存在姿态变化、物体遮挡和背景干扰的不同成像条件等问题，导致行人特征提取不充分。本文提出一种利用多核扩展卷积的无监督视频行人重识别方法，使得提取到的行人特征能够更全面、更准确地表达个体差异和特征信息。首先，采用预训练的ResNet50作为编码器，为了进一步提升编码器的特征提取能力，引入了多核扩展卷积模块，通过增加卷积核的感受野，使得网络能够更有效地捕获到局部和全局的特征信息，从而更全面地描述行人的外貌特征；其次，通过解码器将高级语义信息还原为更为底层的特征表示，从而增强特征表示，提高系统在复杂成像条件下的性能；最后，在解码器的输出中引入多尺度特征融合模块融合相邻层中的特征，进一步减少不同特征通道层之间的语义差距，以产生更鲁棒的特征表示。在3个主流数据集上进行离线实验，结果表明该方法在准确性和鲁棒性上均取得了显著的改进。

来源出处

基于多核扩展卷积的无监督视频行人重识别 http://sjcj.nuaa.edu.cn/sjcjycl/article/abstract/202405011