期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 面向知识推理的位置编码标题生成模型
王雅伦, 张仰森, 朱思文
《计算机应用》唯一官方网站    2025, 45 (2): 345-353.   DOI: 10.11772/j.issn.1001-9081.2024030281
摘要170)   HTML30)    PDF (1511KB)(481)    收藏

义原作为最小的语义单位对于标题生成任务至关重要。尽管义原驱动的神经语言模型(SDLM)是主流模型之一,但它在处理长文本序列时编码能力有限,未充分考虑位置关系,易引入噪声知识进而影响生成标题的质量。针对上述问题,提出一种基于Transformer的生成式标题模型Tran-A-SDLM(Transformer Adaption based Sememe-Driven Language Model with positional embedding and knowledge reasoning)。该模型充分结合自适应位置编码和知识推理机制的优势。首先,引入Transformer模型以增强模型对文本序列的编码能力;其次,利用自适应位置编码机制增强模型的位置感知能力,从而增强对上下文义原知识的学习;此外,引入知识推理模块,用于表示义原知识,并指导模型生成准确标题;最后,为验证Tran-A-SDLM的优越性,在大规模中文短文本摘要(LCSTS)数据集上进行实验。实验结果表明,与RNN-context-SDLM相比,Tran-A-SDLM在ROUGE-1、ROUGE-2和ROUGE-L值上分别提升了0.2、0.7和0.5个百分点。消融实验结果进一步验证了所提模型的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 融合多粒度语言知识与层级信息的中文命名实体识别模型
于右任, 张仰森, 蒋玉茹, 黄改娟
《计算机应用》唯一官方网站    2024, 44 (6): 1706-1712.   DOI: 10.11772/j.issn.1001-9081.2023060833
摘要253)   HTML17)    PDF (1485KB)(191)    收藏

针对当前大多数命名实体识别(NER)模型只使用字符级信息编码且缺乏对文本层次信息提取的问题,提出一种融合多粒度语言知识与层级信息的中文NER(CNER)模型(CMH)。首先,使用经过多粒度语言知识预训练的模型编码文本,使模型能够同时捕获文本的细粒度和粗粒度语言信息,从而更好地表征语料;其次,使用ON-LSTM(Ordered Neurons Long Short-Term Memory network)模型提取层级信息,利用文本本身的层级结构信息增强编码间的时序关系;最后,在模型的解码端结合文本的分词信息,并将实体识别问题转化为表格填充问题,以更好地解决实体重叠问题并获得更准确的实体识别结果。同时,为解决当前模型在不同领域中的迁移能力较差的问题,提出通用实体识别的理念,通过筛选多领域的通用实体类型,构建一套提升模型在多领域中的泛化能力的通用NER数据集MDNER(Multi-Domain NER dataset)。为验证所提模型的效果,在数据集Resume、Weibo、MSRA上进行实验,与MECT(Multi-metadata Embedding based Cross-Transformer)模型相比,F1值分别提高了0.94、4.95和1.58个百分点。为了验证所提模型在多领域中的实体识别效果,在MDNER上进行实验,F1值达到了95.29%。实验结果表明,多粒度语言知识预训练、文本层级结构信息提取和高效指针解码器对模型的性能提升至关重要。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 大语言模型驱动的立场感知事实核查
姜雨杉, 张仰森
《计算机应用》唯一官方网站    2024, 44 (10): 3067-3073.   DOI: 10.11772/j.issn.1001-9081.2023101407
摘要161)   HTML8)    PDF (1036KB)(41)    收藏

为解决事实核查领域的证据立场不平衡和忽略立场信息的问题,提出一种大语言模型(LLM)驱动的立场感知事实核查(LLM-SA)方法。首先,使用LLM推理并生成一系列与原始声明立场不同的辩证声明,使事实核查任务能够获取不同立场的视角;其次,通过语义相似度计算衡量每个证据句子与原始声明及辩证声明之间的相关性,并从证据句子中分别选择与两者语义上最相近的k个句子,作为支持或反对原始声明的证据,从而获得代表不同立场的证据,有助于事实核查模型综合多角度的信息,更准确地评估声明的真实性;最后,引入BERT-StuSE(Bidirectional Encoder Representations from Transformers-based Stance-infused Semantic Encoding network)模型,利用多头注意力机制充分融合证据的语义和立场信息,并更全面、客观地判断声明和证据的关系。在CHEF数据集上的实验结果表明,与BERT方法相比,所提方法在测试集上的Micro F1值和Macro F1值分别提高了3.52、3.90个百分点,达到较好的水平。验证了所提方法的有效性,以及考虑不同立场的证据和充分利用证据的立场信息对事实核查的性能提升具有重要意义。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 基于关联关系的微博用户可信度分析方法
李付民, 佟玲玲, 杜翠兰, 李扬曦, 张仰森
计算机应用    2017, 37 (3): 654-659.   DOI: 10.11772/j.issn.1001-9081.2017.03.654
摘要646)      PDF (972KB)(493)    收藏
随着微博研究的深入,对微博用户可信度的评价成为一个研究热点。针对微博用户可信度评价的问题,提出了一种基于关联关系的用户可信度分析方法。以新浪微博为研究对象,首先从用户的资料信息、交互信息和行为信息三个方面出发,分析了用户的7个相关特征,利用层次分析法(AHP),进而得到用户自评价可信度;然后以用户自评价作为基点,以用户关系网络作为载体,结合用户之间潜在的用户互评关系,通过改进PageRank算法,提出了用户可信度评价模型User-Rank,进而,利用关系网络中其他用户对待分析用户的可信度进行综合评价。大规模的微博真实数据的实验表明,所提方法能够取得良好的用户可信度评价效果。
参考文献 | 相关文章 | 多维度评价
5. 基于规则与统计的Web突发事件新闻多层次分类
夏华林 张仰森
计算机应用    2012, 32 (02): 392-415.   DOI: 10.3724/SP.J.1087.2012.00392
摘要1220)      PDF (616KB)(591)    收藏
为了适应Web新闻以指数趋势增长,传播迅速,且Web突发事件新闻在互联网上散布等特点,同时针对传统文本分类方法准确率和效率低,寻找特定主题的突发事件新闻信息难等问题,提出一种基于规则与统计相结合的Web突发事件新闻多层次自动分类方法。首先提取类别关键词形成规则库,然后利用分类规则将突发事件分成四大类,再用朴素贝叶斯分类方法将各大类突发事件新闻进行细分,从而形成了基于规则与统计的两层分类模型。实验结果表明,该分类方法的准确率和召回率都达到90%以上,分类效率也普遍高于传统的分类方法。
参考文献 | 相关文章 | 多维度评价