计算机应用 ›› 2012, Vol. 32 ›› Issue (05): 1329-1331.

• 人工智能 • 上一篇    下一篇

改进的基因术语间语义相似度计算方法

张玉芳1,徐安龙2   

  1. 1. 重庆大学计算机学院
    2. 重庆大学 计算机学院,重庆 400030
  • 收稿日期:2011-11-10 修回日期:2012-01-08 发布日期:2012-05-01 出版日期:2012-05-01
  • 通讯作者: 徐安龙
  • 作者简介:张玉芳(1965-),女,上海人,教授,博士,主要研究方向:数据挖掘、语义信息处理;徐安龙(1988-),男,江苏盐城人,硕士研究生,主要研究方向:语义网、生物信息学。
  • 基金资助:

    国家自然科学基金资助项目(61074145)

Improved computation method for semantic similarity between gene ontology terms

XU An-long2   

  • Received:2011-11-10 Revised:2012-01-08 Online:2012-05-01 Published:2012-05-01
  • Contact: XU An-long

摘要: 目前,基于混合方法的相似度计算对影响语义相似度的因素分析不全面。针对这个问题,提出了基于多个影响术语语义相似度度量因素的综合方法。该方法结合语义层次,语义距离和局部语义密度,充分运用本体的语义信息来计算基因术语间的语义相似度。实验结果表明,该方法与人工打分的相关系数更高。

关键词: 基因本体, 基因术语, 语义相似度, 多因素

Abstract: The current hybrid semantic similarity computation methods do not take full consideration of related factors. Concerning this problem, this paper proposed an integrated method based on multiple factors that affect the calculation of the semantic similarity of Gene Ontology (GO) terms. This method integrated the semantic level, semantic distance and local semantic density, and utilized the semantic information of ontology to fully compute the semantic similarity of gene terms. The experimental results show that the method has higher correlation coefficient with manual scoring than other methods.

Key words: Gene Ontology (GO), gene term, semantic similarity, multiple factor

中图分类号: