检索结果

Select

1. 构建预训练动态图神经网络预测学术合作行为消失

杜郁, 朱焱

《计算机应用》唯一官方网站 2024, 44 (9): 2726-2731. DOI: 10.11772/j.issn.1001-9081.2023091325

摘要（204）

HTML （2）

PDF （1708KB）（143）

现有链接消失问题研究工作一部分只停留在发现和分析链接消失的原因上，一部分仅使用静态网络表示进行预测，很少从网络动态演化的角度分析链接消失预测问题。针对以上研究现状，提出一种预训练动态图神经网络学术合作行为消失预测模型PreDGN（Pre-trained Dynamic Graph neural Network）。PreDGN首先通过动态图生成预训练任务捕捉动态网络的时间信息，同时利用时序模体构造的边特征补充网络的拓扑信息；其次，结合基于时间编码的注意力节点嵌入，能够更精准地学习节点的表征。经过预训练的模型学习了动态图的历史信息，而且可以在特定的学术合作行为消失预测任务中进行微调。使用公开学术合作数据集HepTh中不同时间跨度、不同数据规模数据进行实验的结果表明，在1996、1997、94—96和97—99子数据集上，相较于次优的动态图神经网络方法（DyRep），所提模型的曲线下面积（AUC）指标分别提高了10.47、8.16、13.41和3.27个百分点，平均精度（AP）指标分别提高了5.87、2.15、8.26和3.01个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于局部扩展社区发现的学术异常引用群体检测

林欣蕊, 王晓菲, 朱焱

《计算机应用》唯一官方网站 2024, 44 (6): 1855-1861. DOI: 10.11772/j.issn.1001-9081.2023050702

摘要（157）

HTML （7）

PDF （1689KB）（103）

学术社交网络中的某些学者可能组成异常引用群体，相互之间过度引用彼此的文章以谋取利益。现有的异常群体检测算法大多将社区检测与节点表示学习分离，导致最终异常群体检测性能受限。为此，提出一种基于局部扩展社区发现的异常引用群体检测（GADL）算法。所提算法利用论文研究领域、标题内容等语义信息提取作者异常引用特征；定义基于节点转移相似度、节点社区隶属度、引用异常度和广度优先遍历（BFS）深度的扩展度量函数；结合异常社区发现和异常节点检测，在统一框架下对二者联合优化，可获得最优的异常检测性能。在ACM、DBLP1和DBLP2数据集上，相较于ALP算法，所提算法分别提高了6.07%、5.35%和3.38%。在真实数据集上的实验结果表明，所提算法可有效地检测异常学术引用。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 融合反讽机制的攻击性言论检测

王海涵, 朱焱

《计算机应用》唯一官方网站 2024, 44 (4): 1065-1071. DOI: 10.11772/j.issn.1001-9081.2023040533

摘要（207）

HTML （15）

PDF （2696KB）（79）

互联网上的攻击性言论严重扰乱了正常网络秩序，破坏了健康交流的网络环境。现有的检测技术更关注文本中的鲜明特征，难以发现更隐晦的攻击方式。针对上述问题，提出融合反讽机制的攻击性言论检测模型BSWD（Bidirectional Encoder Representation from Transformers-based Sarcasm and Word Detection）。首先，提出基于反讽机制的模型Sarcasm-BERT，以检测言论中的语义冲突；其次，提出细粒度词汇攻击性特征提取模型WordsDetect，检测言论中的攻击性词汇；最后，融合两种模型得到BSWD。实验结果表明，与BERT（Bidirectional Encoder Representation from Transformers）、HateBERT模型相比，所提模型的准确率、精确率、召回率和F1分数指标大部分能提升2%，显著提高了检测性能，更能发现隐含的攻击性言论；同时，与SKS（Sentiment Knowledge Sharing）、BiCHAT（Bidirectional long short-term memory with deep Convolution neural network and Hierarchical ATtention）模型相比，具有更强的泛化能力和鲁棒性。以上结果验证了BSWD检测隐晦攻击性言论的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 用于未对齐多模态语言序列情感分析的多交互感知网络

罗俊豪, 朱焱

《计算机应用》唯一官方网站 2024, 44 (1): 79-85. DOI: 10.11772/j.issn.1001-9081.2023060815

摘要（249）

HTML （13）

PDF （1299KB）（526）

针对现有对齐多模态语言序列情感分析方法常用的单词对齐方法缺乏可解释性的问题，提出了一种用于未对齐多模态语言序列情感分析的多交互感知网络（MultiDAN）。MultiDAN的核心是多层的、多角度的交互信息提取。首先使用循环神经网络（RNN）和注意力机制捕捉模态内的交互信息；然后，使用图注意力网络（GAT）一次性提取模态内及模态间的、长短期的交互信息；最后，使用特殊的图读出方法，再次提取图中节点的模态内及模态间交互信息，得到多模态语言序列的唯一表征，并应用多层感知机（MLP）分类获得序列的情感分数。在两个常用公开数据集CMU-MOSI和CMU-MOSEI上的实验结果表明，MultiDAN能充分提取交互信息，在未对齐的两个数据集上MultiDAN的F1值比对比方法中最优的模态时空注意图（MTAG）分别提高了0.49个和0.72个百分点，具有较高的稳定性。MultiDAN可以提高多模态语言序列的情感分析性能，且图神经网络（GNN）能有效提取模态内、模态间的交互信息。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 基于梯度分布调节策略的Xgboost算法优化

李浩, 朱焱

计算机应用 2020, 40 (6): 1633-1637. DOI: 10.11772/j.issn.1001-9081.2019101878

摘要（623）

PDF （515KB）（501）

为了解决集成学习模型Xgboost在二分类问题中少数类检出率低的问题，提出了基于梯度分布调节策略的改进的Xgboost算法——LCGHA-Xgboost。首先，通过定义损失贡献（LC）来模拟Xgboost算法中样本个体的损失量；而后，通过定义损失贡献密度（LCD）来衡量Xgboost算法中样本被正确分类的难易程度；最后，提出了梯度分布调节算法LCGHA，依据LCD动态调整样本个体的一阶梯度分布，间接地增大难分样本（主要存在于少数类中）的损失量，减小易分样本（主要存在于多数类中）的损失量，使Xgboost算法偏向对难分样本的学习。实验结果表明,与Xgboost、GBDT、随机森林（Random_Forest）这三大集成学习算法相比，LCGHA-Xgboost算法在多个UCI数据集上的召回率（Recall）值有5.4%~16.7%的提高，AUC值有0.94%~7.41%的提高；在垃圾网页数据集WebSpam-UK2007和DC2010数据集上所提算法的Recall值更是有44.4%~383.3%的提高，AUC值有5.8%~35.6%的提高。LCGHA-Xgboost算法可以有效提高对少数类的分类检出能力，减小少数类的分类错误率。

参考文献 | 相关文章 | 多维度评价

Select

6. 基于卷积神经网络和代价敏感的不平衡图像分类方法

谭洁帆, 朱焱, 陈同孝, 张真诚

计算机应用 2018, 38 (7): 1862-1865. DOI: 10.11772/j.issn.1001-9081.2018010152

摘要（957）

PDF （804KB）（572）

针对不平衡图像分类中少数类查全率低、分类结果总代价高，以及人工提取特征主观性强而且费时费力的问题，提出了一种基于Triplet-sampling的卷积神经网络（Triplet-sampling CNN）和代价敏感支持向量机（CSSVM）的不平衡图像分类方法——Triplet-CSSVM。该方法将分类过程分为特征学习和代价敏感分类两部分。首先，利用误差公式为三元损失函数的卷积神经网络端对端地学习将图像映射到欧几里得空间的编码方法；然后，结合采样方法重构数据集，使其分布平衡化；最后，使用CSSVM分类算法给不同类别赋以不同的代价因子，获得最佳代价最小的分类结果。在深度学习框架Caffe上使用人像数据集FaceScrub进行实验。实验结果表明，所提方法在1∶3的不平衡率下，与VGGNet-SVM方法相比，少数类的精确率提高了31个百分点，召回率提高了71个百分点。

参考文献 | 相关文章 | 多维度评价

Select

7. 欺诈网页检测中基于遗传算法的特征优选

王嘉卿, 朱焱, 陈同孝, 张真诚

计算机应用 2018, 38 (1): 295-299. DOI: 10.11772/j.issn.1001-9081.2017061560

摘要（487）

PDF （807KB）（391）

针对网页欺诈检测中特征的高维、冗余问题，提出一个基于信息增益和遗传算法的改进特征选择算法（IFS-BIGGA）。首先，通过信息增益（IG）给出特征重要性排序，设定动态阈值减少冗余特征；其次，改进遗传算法（GA）中染色体编码函数和选择算子，并结合随机森林（RF）的受试者工作特征曲线面积（AUC）作为适应度函数，选择高辨识度特征；最后，增加实验迭代次数避免算法随机性，产生最佳最小的特征集合（OMFS）。实验验证表明，应用IFS-BIGGA生成的OMFS与高维特征集合相比，尽管RF下的AUC减小了2%，但是真阳性率（TPR）提高了21%，并且特征维度减少了92%；同时多个常用分类器的平均检测时间减少了83%；另外，IFS-BIGGA的F1值相比传统的遗传算法（TGA）和帝国主义竞争算法（ICA）分别提高了4.2%和3.5%。实验结果表明，IFS-BIGGA可以进行高效特征降维，在实际的网页检测工程中，有效减少计算代价，提高检测效率。

参考文献 | 相关文章 | 多维度评价

Select

8. 主题相似度与链接权重相结合的垃圾网页排序检测

韦莎, 朱焱

计算机应用 2016, 36 (3): 735-739. DOI: 10.11772/j.issn.1001-9081.2016.03.735

摘要（485）

PDF （737KB）（345）

针对因Web中存在由正常网页指向垃圾网页的链接,导致排序算法(Anti-TrustRank等)检测性能降低的问题,提出了一种主题相似度和链接权重相结合,共同调节网页非信任值传播的排序算法,即主题链接非信任排序(TLDR)。首先,运用隐含狄利克雷分配(LDA)模型得到所有网页的主题分布,并计算相互链接网页间的主题相似度;其次,根据Web图计算链接权重,并与主题相似度结合,得到主题链接权重矩阵;然后,利用主题链接权重调节非信任值传播,改进Anti-TrustRank和加权非信任值排序(WATR)算法,使网页得到更合理的非信任值;最后,将所有网页的非信任值进行排序,通过划分阈值检测出垃圾网页。在数据集WEBSPAM-UK2007上进行的实验结果表明,与Anti-TrustRank和WATR相比,TLDR的SpamFactor分别提高了45%和23.7%,F1-measure(阈值取600)分别提高了3.4个百分点和0.5个百分点, spam比例(前三个桶)分别提高了15个百分点和10个百分点。因此,主题与链接权重相结合的TLDR算法能有效提高垃圾网页检测性能。

参考文献 | 相关文章 | 多维度评价

Select

9. 智慧轨道交通——实现更深入的智能化

杨燕朱焱戴齐李天瑞

计算机应用 2012, 32 (05): 1205-1207.

摘要（1668）

PDF （2286KB）（1315）

当前轨道交通已成为居民出行的重要交通工具之一。智慧轨道交通的核心是要通过现代信息技术以一种更加智慧的方法来改变现有轨道交通方式，为人类社会活动带来更加快捷、安全、舒适的智慧交通系统。讨论了智慧轨道交通中更深入的智能化的四个关键步骤：数据智慧采集、数据智慧融合、数据智慧挖掘和智慧决策。这四个步骤形成一个螺旋上升的智能信息处理过程，最终可以达到智慧轨道交通更深入的智能化目的。

参考文献 | 相关文章 | 多维度评价

Select

10. 改进语言规则中的表示的隐喻识别技术

杨青朱焱

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2024071037
预出版日期: 2024-11-19

Select

11. 结合预处理方法和对抗学习的公平链接预测

彭一峰朱焱

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2024081117
预出版日期: 2024-11-27

Select

12. 融合反讽机制的攻击性言论检测

王海涵朱焱

《计算机应用》唯一官方网站 DOI: 10.1 1772/j.issn.1001-9081.2023040533
录用日期: 2024-01-05