摘要: 微博作为人们获取和传播新闻事件的主要平台,隐藏着丰富的事件信息。从微博抽取故事线能为用户提供一种直观的方式来准确理解事件演化,然而微博数据稀疏和上下文缺乏的特点为故事线抽取带来挑战。为此通过两个连续的任务从微博数据自动抽取故事线:1)基于微博传播影响力对事件进行建模,提取首要事件;2)基于事件特征建立异构事件图,提出事件图卷积网络(E-GCN)模型,提升对事件间隐式关系的学习能力,实现事件的故事分支预测并链接事件。在真实数据集上从故事分支和故事线两个角度进行评测,结果表明所提方法在故事分支生成上,较贝叶斯模型、斯坦纳树和故事森林在F1值中,数据集1分别高出28%、20%和27%,数据集2分别高出19%、12%和22%;而在故事线评测上,较故事时间线、斯坦纳树和故事森林在正确的边指标中,数据集1中分别高出33%、23%和17%,数据集2中分别高出12%、3%和9%。
中图分类号: