随着城市安防系统的迅速建设,摄像机的数量指数上升,采用人工方法在摄像机集群中追踪行人更加艰难,所以基于深度学习的多目标跟踪方法取得了迅速的发展。本文主要研究了一种非重叠视域多摄像机场景下对多个行人进行跟踪的算法,将其分为三个子问题进行研究,并提出优化和改进的方案。
首先,为解决行人跨相机视域时因视角、光照影响导致特征表达能力不足的问题,提出了一种适应跨视域的特征提取算法。该算法将IBN块嵌入分类网络骨架Res Net应对图像风格转换问题。同时提出随机灰度擦除的数据增强方法,有效改善光照对行人重识别模型的影响。在模型训练时使用Circle Loss代替了Soft Max Loss和Triplet Loss的组合,并结合Center Loss来加强特征的内聚性。该算法在Market1501和Duke MTMC-Re ID两大数据集上训练并在精度上取得显著体提升。
然后,为解决Deep Sort算法应对遮挡能力不足的问题,本文设计一种数据存储结构,使其能够保存更长久的行人特征。给出融合距离信息的IOU关联方案,提高卡尔曼滤波预测的容错率。同时提出低置信度检测关联方法,将被遮挡的轨迹与低置信度检测进行关联,减少因遮挡导致身份切换的次数。将改进的算法在MOT16数据集进行验证。实验结果表明本文做出的改进提升了跟踪的准确度。
最后,为了解决行人跨相机时无法准确识别身份的问题,加入时空信息,并利用Parzen窗平滑时间-频次直方图来获取直观的时空概率。同时为每个轨迹设置5种状态,给出由状态间的转换确定的跟踪流程,明确了轨迹创建与删除的条件。在Duke MTMC数据集验证本文提出的算法,证明其能够在跨摄像机场景下准确关联行人并完成跟踪。 摘要译文
行人重识别; 数据增强; Deep Sort; 多目标跟踪
081104[模式识别与智能系统];081205[人工智能];081206[计算机应用技术];0835[软件工程]
10.27324/d.cnki.gshkc.2022.000589