计算机应用 ›› 2018, Vol. 38 ›› Issue (3): 626-632.DOI: 10.11772/j.issn.1001-9081.2017082087
孙健1, 高大启1, 阮彤1, 殷亦超2, 高炬2, 王祺1
收稿日期:
2017-08-28
修回日期:
2017-11-04
发布日期:
2018-03-07
出版日期:
2018-03-10
通讯作者:
王祺
作者简介:
孙健(1993-),女,安徽六安人,硕士研究生,CCF会员,主要研究方向:信息抽取、知识图谱;高大启(1957-),男,湖北襄阳人,教授,博士,CCF会员,主要研究方向:机器嗅觉、智能理论、模式识别;阮彤(1973-),女,江苏扬州人,教授,博士,CCF会员,主要研究方向:信息抽取、知识图谱、数据质量评估;殷亦超(1983-),男,上海人,工程师,硕士,主要研究方向:医院信息化;高炬(1966-),男,上海人,主任医师,硕士,主要研究方向:医院行政管理、中西医结合治疗肝胆病;王祺(1993-),男,江苏苏州人,硕士研究生,CCF会员,主要研究方向:信息抽取、知识图谱、机器翻译。
基金资助:
SUN Jian1, GAO Daqi1, RUAN Tong1, YIN Yichao2, GAO Ju2, WANG Qi1
Received:
2017-08-28
Revised:
2017-11-04
Online:
2018-03-07
Published:
2018-03-10
Supported by:
摘要: 中文电子病历中的时间关系包括句内时间关系和句间时间关系,其中,句内时间关系包括句内事件-事件的时间关系和句内事件-时间的时间关系,句间时间关系即是句间事件-事件的时间关系。把中文电子病历文本中的时间关系识别转化成实体对分类问题,针对句内时间关系的识别,制定了高准确率的启发式规则,并设计了基本特征、短语句法特征、依存特征和其他特征,训练分类器缓解句内时间关系的识别错误;针对句间时间关系的识别,在高准确率的启发式规则之外,设计了基本特征、短语句法特征和其他特征,训练分类器减少句间时间关系的识别错误。实验结果表明,当分别使用支持向量机(SVM)、SVM和随机森林(RF)算法时,所提方法在句内事件-事件、句内事件-时间和句间事件-事件的时间关系识别上的效果最好,其F1值分别达到了84.0%、85.6%和63.5%。
中图分类号:
孙健, 高大启, 阮彤, 殷亦超, 高炬, 王祺. 中文电子病历中的时间关系识别[J]. 计算机应用, 2018, 38(3): 626-632.
SUN Jian, GAO Daqi, RUAN Tong, YIN Yichao, GAO Ju, WANG Qi. Recognition of temporal relation in Chinese electronic medical records[J]. Journal of Computer Applications, 2018, 38(3): 626-632.
[1] SUN W, RUMSHISKY A, UZUNER O. Temporal reasoning over clinical text:the state of the art[J]. Journal of the American Medical Informatics Association, 2013, 20(5):814-819. [2] SUN W, RUMSHISKY A, UZUNER O. Evaluating temporal relations in clinical text:2012 i2b2 Challenge[J]. Journal of the American Medical Informatics Association, 2013, 20(5):806-813. [3] 王昀,苑春法.基于转换的时间-事件关系映射[J].中文信息学报,2004,18(4):24-31.(WANG Y, YUAN C F. A time-event mapping method based transformation[J]. Journal of Chinese Information Processing, 2004, 18(4):24-31.) [4] 林静,苑春法.汉语时间关系抽取与计算[J].中文信息学报,2009,23(5):62-67.(LIN J, YUAN C F. Extraction and computation of Chinese temporal relation[J]. Journal of Chinese Information Processing, 2009, 23(5):62-67.) [5] 王风娥,谭红叶,钱揖丽.基于最大熵的句内时间关系识别[J].计算机工程,2012,38(4):37-39.(WANG F E, TAN H Y, QIAN Y L. Recognition of temporal relation in one sentence based on maximum entropy[J]. Computer Engineering, 2012, 38(4):37-39.) [6] 刘莉.中文时间事件关系识别的方法研究[D].重庆:重庆大学,2012:33-35.(LIU L. Research on automatic identification of temporal relations between Chinese time expressions and events[D]. Chongqing:Chongqing University, 2012:33-35.) [7] D'SOUZA J, NG V. Classifying temporal relations in clinical data:a hybrid, knowledge-rich approach[J]. Journal of Biomedical Informatics, 2013, 46:S29-S39. [8] NIKFARJAM A, EMADZADEH E, GONZALEZ G. Towards generating a patient's timeline:extracting temporal relationships from clinical notes[J]. Journal of Biomedical Informatics, 2013, 46:S40-S47. [9] CHENG Y, ANICK P, HONG P, et al. Temporal relation discovery between events and temporal expressions identified in clinical narrative[J]. Journal of Biomedical Informatics, 2013, 46:S48-S53. [10] DO H W, JEONG Y S. Temporal relation classification with deep neural network[C]//Proceedings of the 2016 International Conference on Big Data and Smart Computing. Washington, DC:IEEE Computer Society, 2016:454-457. [11] CHENG F, MIYAO Y. Classifying temporal relations by bidirectional LSTM over dependency paths[C]//Proceedings of the 55th Annual Meeting of the Association for Computational Linguistics (Short Papers). Stroudsburg, PA:Association for Computational Linguistics, 2017, 2:1-6. [12] DLIGACH D, MILLER T, CHEN L, et al. Neural temporal relation extraction[C]//Proceedings of the 15th Conference of the European Chapter of the Association for Computational Linguistics. Stroudsburg, PA:Association for Computational Linguistics, 2017,2:746-751. [13] XU D, ZHANG M, ZHAO T, et al. Data-driven information extraction from Chinese electronic medical records[J]. PLOS ONE, 2015, 10(8):e0136270. [14] HANKCS. HanLP[EB/OL].[2014-12-23]. https://github.com/hankcs/HanLP. [15] STOLCKE A. An efficient probabilistic context-free parsing algorithm that computes prefix probabilities[J]. Computational Linguistics, 1994, 21(2):165-201. [16] DAN K, MANNING C D. Fast exact inference with a factored model for natural language parsing[EB/OL].[2017-03-03]. http://www.ling.helsinki.fi/kit/2008s/clt350/docs/KleinManning-lexpar03.pdf. [17] HOLMES G, DONKIN A, WITTEN I H. WEKA:a machine learning workbench[EB/OL].[2017-03-03]. https://researchcommons.waikato.ac.nz/bitstream/handle/10289/1138/uow-cs-wp-1994-09.pdf;jsessionid=0E603B1F904CF7546CF087199832DD44?sequence=1. |
[1] | 张庆 杨凡 方宇涵. 基于多模态信息融合的中文拼写纠错算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 高颖杰, 林民, 斯日古楞null, 李斌, 张树钧. 基于片段抽取原型网络的古籍文本断句标点提示学习方法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3815-3822. |
[3] | 王猛 张大千 周冰艳 马倩影 吕继东. 基于时序知识图谱补全的CTCS-3级列控车载接口设备故障诊断方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[4] | 杨青 朱焱. 改进语言规则中的表示的隐喻识别技术[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[5] | 余婧 陈艳平 扈应 黄瑞章 秦永彬. 结合实体边界偏移的序列标注优化方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 张伟 牛家祥 马继超 沈琼霞. 深层语义特征增强的ReLM中文拼写纠错模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 徐章杰 陈艳平 扈应 黄瑞章 秦永彬. 联合边界生成的多目标学习嵌套命名实体识别[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 代震龙 韩萌 杨文艳 朱诗能 杨书蓉. 序列模式挖掘综述[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[9] | 徐乐 黄瑞章 白瑞娜 秦永彬. 基于意图正则化的深度半监督文本聚类[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[10] | 彭一峰 朱焱. 结合预处理方法和对抗学习的公平链接预测[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[11] | 赵彪 秦玉华 田荣坤 胡月航 陈芳锐. 依赖类型及距离增强的方面级情感分析模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[12] | 任登燃 王淑营. 基于差分边界增强的风电装备嵌套实体识别模型[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[13] | 田海燕 黄赛豪 张栋 李寿山. 视觉指导的分词和词性标注[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[14] | 帅健 王中卿 陈嘉沥. 基于代码生成的细粒度情感分析方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[15] | 姜雨杉, 张仰森. 大语言模型驱动的立场感知事实核查[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3067-3073. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||