针对大多数基于字典学习的无监督特征选择模型没有充分挖掘数据间的本质关联,进而降低了特征重要性判断的准确性这一问题,提出一种字典学习与样本关联保持结合的无监督特征选择模型(DLSCP)。首先,从数据中学习字典基以完成对原始数据的编码,并在字典空间中获得能够反映数据分布的隐表示;其次,进一步在字典空间中自适应地学习数据间的本质关联,以消除冗余特征和噪声特征的影响,从而获得准确的数据间的局部几何结构;最后,利用数据间的本质关联评估数据特征的关联性和重要性。在TOX数据集上的实验结果表明,当选择50个特征时,DLSCP在归一化互信息(NMI)和聚类准确度(Acc)这2个评价指标上,相较于非负谱分析模型NDFS(Nonnegative Discriminative Feature Selection)分别提升了13.33和7.95个百分点,相较于隐空间嵌入无监督特征选择模型LSEUFS(Latent Space Embedding for Unsupervised Feature Selection via joint dictionary learning)分别提升了15.74和7.31个百分点,验证了DLSCP的有效性。
针对工业物联网(IIOT)新增数据量大、工厂子端数据量不均衡的问题,提出了一种基于联邦增量学习的IIOT数据共享方法(FIL-IIOT)。首先,将行业联合模型下发到工厂子端作为本地初始模型;然后,提出联邦优选子端算法来动态调整参与子集;最后,通过联邦增量学习算法计算出工厂子端的增量加权,从而使新增状态数据与原行业联合模型快速融合。实验结果表明,在美国凯斯西储大学(CWRU)轴承故障数据集上,所提FIL-IIOT使轴承故障诊断精度达到93.15%,比联邦均值(FedAvg)算法和无增量公式的FIL-IIOT(FIL-IIOT-NI)方法分别提高了6.18个百分点和2.59个百分点,满足了基于工业增量数据的行业联合模型持续优化的需求。