期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于语境增强的新能源汽车投诉文本方面-观点对抽取
汪才钦, 周渝皓, 张顺香, 王琰慧, 王小龙
《计算机应用》唯一官方网站    2024, 44 (8): 2430-2436.   DOI: 10.11772/j.issn.1001-9081.2023081167
摘要155)   HTML1)    PDF (1921KB)(17)    收藏

挖掘新能源汽车投诉文本中用户对产品多维度的意见,能为产品的设计决策提供参考。因投诉文本具有实体密度高、句式冗长等特点,导致当前方面-观点对抽取(AOPE)方法感知方面项与观点项间的关联性不强。针对这一问题,提出一种基于语境增强的AOPE模型(AOE-CE),通过融合主题特征与文本特征作为语境表示增强实体间的关联关系。模型由实体识别和关系检测2个模块组成:首先,实体识别通过预训练模型和词性标注工具编码文本,再利用双向长短期记忆(Bi-LSTM)网络结合多头注意力捕获上下文信息得到文本特征,并将文本特征输入至条件随机场(CRF)得到实体集合;关系检测通过BERT(Bidirectional Encoder Representations from Transformers)获取主题特征,并将主题特征与文本特征融合获得增强的语境表示,再利用三仿射机制以语境表示为辅助增强实体间的关联关系,最后通过Sigmoid得到抽取结果。实验结果表明,AOE-CE的精准率、召回率和F1值比SDRN(Synchronous Double-channel Recurrent Network)模型分别提升了2.19、1.08和1.60个百分点,表明所提模型具有更好的AOPE效果。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于提示增强与双图注意力网络的复杂因果关系抽取
邓金科, 段文杰, 张顺香, 汪雨晴, 李书羽, 李嘉伟
《计算机应用》唯一官方网站    2024, 44 (10): 3081-3089.   DOI: 10.11772/j.issn.1001-9081.2023101486
摘要100)   HTML1)    PDF (2643KB)(44)    收藏

针对复杂因果句实体密度高、句式冗长等特点导致的外部信息不足和信息传递遗忘问题,提出一种基于提示增强与双图注意力网络(BiGAT)的复杂因果关系抽取模型PE-BiGAT(Prompt Enhancement and Bi-Graph Attention Network)。首先,抽取句子中的结果实体并与提示学习模板组成提示信息,再通过外部知识库增强提示信息;其次,将提示信息输入BiGAT,同时结合关注层与句法和语义依存图,并利用双仿射注意力机制缓解特征重叠的情况,增强模型对关系特征的感知能力;最后,用分类器迭代预测句子中的所有因果实体,并通过评分函数分析句子中所有的因果对。在SemEval-2010 task 8和AltLex数据集上的实验结果表明,与RPA-GCN(Relationship Position and Attention-Graph Convolutional Network)相比,所提模型的F1值提高了1.65个百分点,其中在链式因果和多因果句中分别提高了2.16和4.77个百分点,验证了所提模型在处理复杂因果句时更具优势。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于拼音相似度的中文谐音新词发现方法
李瀚臣, 张顺香, 朱广丽, 王腾科
《计算机应用》唯一官方网站    2023, 43 (9): 2715-2720.   DOI: 10.11772/j.issn.1001-9081.2022091390
摘要427)   HTML18)    PDF (927KB)(327)    收藏

新词识别作为自然语言处理的基础任务之一,为构建中文词典、分析词语情感倾向等提供了支持。然而,目前的新词识别方法没有考虑针对谐音新词的识别,导致谐音新词识别的准确率不高。为了解决这一问题,提出一种基于拼音相似度的中文谐音新词发现方法,引入新旧词拼音比较来提高谐音新词识别的准确率。首先,对文本进行预处理,计算平均互信息(AMI)以判定候选词的内部结合度,并使用改进邻接熵确定候选新词的边界;然后,将保留下的词转换成发音相近的汉语拼音与中文词典中的旧词拼音进行相似度比较,并保留最相似的比较结果;最后,若比较结果超过阈值,则将结果中的新词作为谐音新词,对应的旧词即为谐音新词的原有词。在自建的微博数据集上的实验结果表明,与BNshCNs(Blended Numeric and symbolic homophony Chinese Neologisms)、依存句法与语义信息结合的相似性计算模型(DSSCNN)相比,所提方法的准确率、召回率和F1分数分别提高了0.51和5.27个百分点、2.91和6.31个百分点以及1.75和5.81个百分点。可见所提方法具有更好的中文谐音新词识别效果。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 一种基于平均寻道时间的磁盘调度优化算法
张顺香 朱广丽
计算机应用   
摘要1360)      PDF (657KB)(849)    收藏
针对如何提高磁盘调度效率的问题,提出了一种基于平均寻道时间(AST)的磁盘调度优化算法。对操作系统中几种主要磁盘调度算法的平均寻道时间作深入研究,随机选取几组磁盘服务请求队列,分析在每种算法下磁头移动情况。然后通过模拟和解析,得到不同调度算法的平均寻道时间的摆动规律,进而提出一种基于平均寻道时间的磁盘调度优化算法,使得系统能够在不同的情况下实时地自动选择已有的算法来提高磁盘调度的效率。
相关文章 | 多维度评价
5. 基于Web挖掘的主页多主题更新模型
张顺香 朱广丽 陆奎
计算机应用    2009, 29 (10): 2796-2798.  
摘要1442)      PDF (829KB)(1338)    收藏
针对改善网站主页中多个主题更新的合理性问题,提出了一种新颖的基于Web数据挖掘技术的主页主题更新模型。对当前主页主题更新方法进行分析,指出目前一些大学校园网站主页主题更新的不合理性,然后通过数据挖掘,从安徽理工大学网站Web日志中提取有效数据,分析各个主题的点击率随时间的变化趋势,进而提出基于点击率的网站主页主题更新模型。实验结果证明,模型能够实现对主页主题的合理更新,有效提高网站主页的受欢迎程度。
相关文章 | 多维度评价
6. 集成句法与情感知识的方面级情感分析模型
李自亮 朱广丽 张玉雷 刘佳佳 焦熠璇 张顺香
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2024060903
预出版日期: 2024-08-22

7. CCF BigData2023+P00114+基于语境增强的新能源汽车投诉文本方面-观点对抽取
汪才钦 周渝皓 张顺香 王琰慧 王小龙