面向开源项目推荐开发人员对开源生态建设具有重要意义。区别于传统软件开发,开源领域的开发者、项目、组织及相互关系体现了开放式协作项目的特点,而它们蕴含的语义有助于精准推荐开源项目的开发者。因此,提出一种基于协作贡献网络(CCN)的开发者推荐(DRCCN)方法。首先,利用开源软件(OSS)开发者、OSS项目、OSS组织之间的贡献关系构建CCN;其次,基于CCN构建一个3层深度的异构GraphSAGE (Graph SAmple and aggreGatE)图神经网络(GNN)模型,预测开发者节点和开源项目节点之间的链接,从而产生相应的嵌入对;最后,根据预测结果,采用K最近邻(KNN)算法完成开发者推荐。在GitHub数据集上训练和测试模型的实验结果表明,相较于序列推荐的对比学习模型CL4SRec (Contrastive Learning for Sequential Recommendation),DRCCN在精确率、召回率和F1值这3个指标上分别提升了约10.7%、2.6%和4.2%。因此,所提模型可以为开源社区项目的开发者推荐提供重要的参考依据。
目前较为常用的基于单目视觉的车辆三维检测方法是目标检测结合几何约束的方法,但是几何约束中消失点的位置对结果影响很大。为了获取更加准确的约束条件,提出一种基于地平线检测的车辆三维检测算法。首先,利用车辆图片获取消失点的相对位置,将车辆图片预处理至合适大小;然后,将经过预处理的车辆图片送入消失点检测网络,获得消失点信息热力图组,回归出消失点信息,并计算得出地平线信息;最后,根据地平线信息构建几何约束,在约束空间内对车辆初始尺寸迭代优化计算精确的车辆三维信息。实验结果表明,所述地平线求解算法能够获得更准确的地平线,与随机森林的方法相比,曲线下面积(AUC)提升1.730个百分点;同时,所提地平线约束能够有效地限制车辆三维信息,与使用对角线和消失点约束的算法相比,车辆三维信息的平均精度提升2.201个百分点。可见地平线可以作为几何约束在路侧单目相机的场景下求解车辆三维信息。
为了有效提取连续视频帧间的时间信息,提出一种融合独立循环神经网络(IndRNN)与变分自编码(VAE)网络的预测网络IndRNN-VAE。首先,利用VAE网络提取视频帧的空间信息,并通过线性变换得到视频帧的潜在特征;然后,将潜在特征作为IndRNN的输入以得到视频帧序列的时间信息;最后,通过残差块将获得的潜在变量与时间信息进行融合并输入到解码网络中来生成预测帧。通过在UCSD Ped1、UCSD Ped2、Avenue公开数据集上进行测试,实验结果表明,与现有的异常检测方法相比,基于IndRNN-VAE的方法性能得到了显著提升,曲线下面积(AUC)值分别达到了84.3%、96.2%和86.6%,错误率(EER)值分别达到了22.7%、8.8%和19.0%,平均异常得分的差值分别达到了0.263、0.497和0.293,且运行速度达到了每秒28帧。
针对科技领域文档语义信息获取不充分的问题,提出一套基于规则的数学领域相关文本的语义抽取方法。首先从文本中提取领域概念并实现数学实体与领域概念之间的语义映射;然后对数学符号的上下文进行分析,获取数学符号的实体指代或文字描述,进而抽取其语义;最后基于已抽取的数学符号语义实现表达式的语义分析。以线性代数文本为研究实例,构建了一个语义标注数据集并进行实验,实验结果表明所提方法对标识符、线性代数实体以及表达式的语义抽取具有93%以上的精确率和91%以上的召回率。
联邦学习(FL)是一种能够实现用户数据不出本地的新型隐私保护学习范式。随着相关研究工作的不断深入,FL的单点故障及可信性缺乏等不足之处逐渐受到重视。近年来,起源于比特币的区块链技术取得迅速发展,它开创性地构建了去中心化的信任,为FL的发展提供了一种新的可能。对现有基于区块链的FL框架进行对比分析,深入讨论区块链与FL相结合所解决的FL重要问题,并阐述了基于区块链的FL技术在物联网(IoT)、工业物联网(IIoT)、车联网(IoV)、医疗服务等多个领域的应用前景。
时空预测任务在神经科学、交通、气象等领域应用广泛。气温预测作为典型的时空预测任务,需要挖掘气温数据中固有的时空特征。针对现有气温预测算法存在预测误差大、空间特征提取不充分的问题,提出一种基于图卷积网络和门控循环单元的气温预测(GCN-GRU)模型。首先,使用重新分配权重和多阶近邻连接方式修正图卷积网络(GCN),以有效挖掘气象数据独特的空间特征;然后,将门控循环单元(GRU)中每个循环单元的矩阵乘法替换成图卷积操作,并将所有的循环单元串联起来构成图卷积门控层;接着,使用图卷积门控层搭建网络主体结构来提取数据的时空特征;最后,通过一个全连接的输出层输出气温预测结果。通过与GRU和长短期记忆网络(LSTM)等单一模型对比,GCN-GRU模型的平均绝对误差(MAE)分别减小了0.67和0.83;与切比雪夫图卷积和长短期记忆网络结合的预测模型(Cheb-LSTM)、图卷积网络和长短期记忆网络结合的预测模型(GCN-LSTM)对比,平均绝对误差分别减小了0.36和0.23。
针对异常检测中异常数据与正常数据的比例严重不平衡导致决策树性能下降的问题,提出了C4.5决策树的三种改进方法——C4.5+δ、均匀分布熵(UDE)和改进分布熵函数(IDEF)。首先,推导了C4.5算法中属性选择准则会倾向于选择偏斜划分的属性;然后,分析了偏斜划分使得异常(少数类)检测精度下降的原因;其次,分别通过引入缓和因子、均匀分布熵或替换分布熵函数改进了C4.5算法的属性选择准则——信息增益率;最后,利用WEKA平台和NSL-KDD数据集对改进的决策树进行验证。实验结果表明,三种改进方法均能提高异常检测精度。其中,相比于C4.5,C4.5+7、UDE和IDEF算法在KDDTest-21数据集上的少数类检测精度(灵敏度)分别提高了3.16、3.02和3.12个百分点,均优于采用Rényi熵和Tsallis熵作为分裂准则的方法。此外,利用三种改进的决策树检测工业控制系统中的异常,不仅可以提高异常的查全率还能减小误报率。
谱嵌入聚类(SEC)算法要求样本满足流形假设,样本标签总是可以嵌入到一个线性空间中去,这为线性可分数据的谱嵌入聚类问题提供了新的思路,但该算法使用的线性映射函数不适用于处理高维非线性数据。针对这一问题,通过核化线性映射函数,建立了基于核函数的谱嵌入聚类(KSEC)模型,该模型既能解决线性映射函数不能处理非线性数据的问题,又实现了对高维数据的核降维。在真实数据集上的实验分析结果表明,使用所提算法后聚类正确率平均提高了13.11%,最高可提高31.62%,特别在高维数据上平均提高了16.53%,而且在算法关于参数的敏感度实验中发现算法的稳定性更好。所以改进后的算法对高维非线性数据具有很好的聚类效果,获得了比传统谱嵌入聚类算法更高的聚类准确率和更好的聚类性能。所提方法可以用于诸如遥感影像这类复杂图像的处理领域。
针对稀疏分解运算量巨大的问题,提出了一种针对一阶实值多项式相位信号(PPS)运算量较小的稀疏分解算法,从而实现了稀疏分解的快速性。该算法采用如下策略:首先采用级联字典的方式,即字典D由Df和Dp级联而成,其中字典Df的原子主要考虑一阶实值多项式相位信号的频率成分,不考虑相位因素,而字典Dp的原子主要考虑一阶实值多项式相位信号的相位成分,不考虑频率因素;其次对字典Df的原子与信号进行匹配测试,测试采用群测试算法搜索匹配的原子,并采用二次测试的方法来达到测试的准确性;最后根据测得的匹配频率原子,构造字典Dp,并通过匹配追踪(MP)算法搜索到匹配的相位原子,从而完成了信号的稀疏分解。仿真结果表明该算法的效率约为匹配追踪算法的604倍和遗传算法的139倍,具有运算量小、稀疏分解快的特点,复杂度仅为O(N),而且不具有智能计算的随机性。