摘要: 信息抽取是自然语言处理工作中的重要任务之一,针对由于自然语言的多样性、歧义性和结构性而导致的信息抽取困难的问题,提出了一种面向金融事件信息抽取的层次化词汇-语义模式方法。在该方法中,作者首先定义了一个金融事件表示模型,然后应用基于深度学习的词向量方法来实现自动生成同义概念词典,最后采用基于有限状态机驱动的层次化词汇-语义规则模式实现了对各类金融事件信息自动抽取的目标。通过实验证明,采用这种方法可以从金融新闻文本中准确地抽取各类金融事件信息,并且对26类金融事件的识别准确率(Precision)达到95.9%,F1值达到91%。
中图分类号: