智能监控系统通过实时分析与处理视觉数据,从访问控制、威胁检测、侦查追踪等多个方面为网络空间安全领域提供了坚实基础,显著提升了网络安全事件的预防、识别与响应效能,是网络空间安全体系的关键组成部分。行人重识别是智能监控系统中不可或缺的一环,其旨在对不同摄像机视域下的行人进行身份识别与匹配,从而在大规模监控网络中实现高效且精准的目标行人检索。
当前,尽管基于深度学习的行人重识别方法已取得显著进展,但大多数模型的性能依赖于理想的数据假设,即能够获取大规模行人图像并进行充分的身份标注。然而,这一假设在现实场景中往往难以实现,从而给行人重识别系统的实际应用带来了挑战。首先,行人重识别数据集的标注要求专业人员依据外观、姿态、服装等个体特征,对多个摄像机视域下的行人进行精准区分,这一过程不仅耗时,而且成本高昂,使得获取充足的身份标注变得困难。此外,由于个人隐私受到大部分国家或地区法律的严格保护,行人重识别数据具备高度的隐私敏感性,使得在特定应用场景下难以采集对应数据训练模型。针对上述挑战,本文立足于数据受限场景,(1)首先探讨应用场景中标注受限问题,(2)然后逐步过渡到应用场景完全无标注问题,(3)最终深入研究应用场景中无可用数据的极端问题,分别针对现有方法的不足提出相应的解决方案,具体如下:
针对应用场景标注受限问题,本文提出了一种基于多粒度主动学习策略的半监督学习方法,旨在从无标注数据中选择对模型性能提升最具价值的样本进行标注,从而以最小的标注量来最大化模型性能。具体而言,该方法在第一阶段通过聚类步骤为无标注数据赋予伪标签,以利用数据内在相似性实现自动标注,从而减少人工标注的需求。随后,该方法将每个簇内部的杂质样本,即当前模型无法区分的难样本,认定为高价值样本,并在第二阶段提出了一种基于中心度的自适应纯化策略,实现对难样本的高效搜索。通过对难样本的伪标签进行人工标注修正,并结合纯化损失函数来引导模型学习,可以显著提升模型对难样本的识别能力。在多个行人重识别数据集上的实验结果表明,本文提出的方法能够有效提升在标注受限场景下模型的性能。
针对应用场景完全无标注问题,本文提出了一种基于Transformer的语义融合域适应方法,旨在借助有标注的相似源域来训练模型,并迁移至无标注的目标域。该方法无需访问源域数据,仅利用源域模型和目标域无标注数据来实现模型迁移,有效解除了隐私敏感性带来的应用限制。具体而言,该方法通过分析Transformer分类嵌入特征的更新机制,探索语义信息聚合的深层模式,并识别出关键的模型参数来引导目标域中的语义聚合过程。此外,为了挖掘数据中的内在语义信息,该方法进一步提出了一个显著图像块嵌入特征扩展模块。该模块动态筛选显著嵌入特征并限制其更新,激发其他嵌入特征的学习与优化,以促进目标域数据的内部深层语义信息的提取。在多个无监督域适应基准测试上的实验结果表明,本文提出的方法能在无标注应用场景取得优异的性能。
针对应用场景无可用数据问题,本文提出了一种基于多样特征空间学习与域分解的域泛化方法,旨在利用现有公开数据集训练强泛化行人重识别系统,使其不需要经过任何训练更新便可以泛化至应用场景。具体而言,该方法由特征多样化模块和域自适应选择模块组成。前者通过促进特征通道的独立性和互补性来学习多样化公共特征空间,后者通过将每个域建模成公共特征空间中的子空间,并基于每个子空间上的投影实现通道层面的特征选择来适应未知数据分布。此外,为了从多个角度评估模型的泛化能力,本文建立了一个全面的新基准测试,该基准测试包含在不同时间、不同地点下收集的12个不同规模的数据集,并设计了5种评估协议来模拟不同类型的泛化场景。在公开基准测试和提出的基准测试上的实验结果表明,本文提出的方法可以有效提升模型的泛化能力,使得模型在没有应用场景数据进行训练的情况下,也能展现出优秀的性能。
综上所述,本文面向数据受限场景,对标注受限、无标注、无可用数据等各类限制条件下的行人重识别方法进行了深入的分析和研究,从降低人工标注的需求、增强模型的迁移性和泛化性等角度出发,提出了多种方法来提升行人重识别模型在数据受限场景下的适用性和鲁棒性,为行人重识别系统的实际应用奠定了坚实的技术基础。 摘要译文