摘要: 数据融合是在使用多数据源构建神经网络时面临的关键技术之一。基于传统机器学习的数据融合方法因依赖手动特征选择而耗时且误差较大,影响数据融合方法的效率和准确率。相对而言,基于深度学习的数据融合方法可以从原始数据中提取基本信息,然后将这些基本信息逐渐融合,转化为更高级别的表示信息,提高方法的准确率和效率。然而,这些方法常常忽略现实数据的特殊性,不能充分挖掘数据间复杂的空间关系,并缺乏对冗余数据的处理,导致训练时间长,占用更多内存。此外,简单的特征拼接和不平衡的特征处理未能有效融合或捕捉长距离依赖。在样本标签较少的情况下,数据融合方法的准确率也不理想。为了解决上述存在的问题,本文做了以下工作:
首先,针对现有模型不能充分挖掘和分析数据间复杂的空间关系和依赖性的问题,提出了一种基于残差图卷积的数据融合方法(data fusion method based on Residual Graph Convolution Network,Res-GCN)。首先将数据表示为图结构,并利用图卷积网络(Graph Convolution Network,GCN)考虑节点及其邻居的信息来提取复杂的空间特征,并融合了具有强相关性节点的复杂空间特征。进一步地,通过残差连接,该方法能够在不丢失输入信息的前提下加深网络层次,从而提取更深层次的特征。同时,引入基于自注意力的图池化(Self-Attention Graph Pooling,SAGP)技术,优化了关键特征的筛选,确保只有最有价值的信息被保留和进一步处理。最后,在IEEE39总线系统产生的数据集上进行了实验,结果表明,该方法取得了较高的准确率。
其次,针对现有模型未充分处理传感器数据间的冗余性,导致训练时间过长和内存占用增加的问题,提出了一种融合层次聚类的特征增强卷积数据融合方法(data fusion method integrating Hierarchical Clustering and Feature Augmentation Convolutional Neural Network,HC-CNN-FA)。首先,通过层次聚类(Hierarchical Clustering,HC)对传感器数据进行预处理,有效降低数据冗余并按相似性进行分组,实现数据级的融合。这一步骤不仅提升了训练的效率,也保留了数据的代表性和多样性。接着,使用卷积神经网络(Convolutional Neural Network,CNN)深入分析预处理后的数据,提取出关键的空间特征。最后,通过引入特征增强层(Feature Augmentation,FA),该层通过自适应权重分配优化特征处理,增强了特征间的相互作用和整体信息的融合。大量实验表明,该方法在性能方面优于其他方法。
最后,针对现有模型不能有效捕捉序列中的长距离依赖关系,平等关注提取的特征,并在样本标签较少的情况下模型准确率较低的问题,提出了一种融合多头注意力的多任务卷积数据融合方法(data fusion method integrating Multi-Head Attention Multi-Task Convolution,MHA-MTC)。该方法继承了HC-CNN-FA中使用层次聚类在预处理阶段有效降低数据冗余的策略,以优化数据输入。结合CNN和多头注意力机制,不仅处理局部特征,更通过多头注意力精准捕捉和融合序列数据中的长距离依赖关系。此外,引入了对比学习任务,该任务通过对相似样本进行聚合并分离不相似样本,加强了特征的区分度和融合效果。对比学习作为一种自监督学习方法,尤其适用于样本标签较少的情况,能提高模型的准确率。实验表明,该方法在性能方面优于其他方法。