计算机应用 ›› 2011, Vol. 31 ›› Issue (10): 2774-2777.DOI: 10.3724/SP.J.1087.2011.02774

• 人工智能 • 上一篇    下一篇

仿分子动理学数据聚类法在基因表达数据上的应用

李俊林,符红光   

  1. 电子科技大学 计算机科学与工程学院,成都 610054
  • 收稿日期:2011-03-10 修回日期:2011-04-21 发布日期:2011-10-11 出版日期:2011-10-01
  • 通讯作者: 李俊林
  • 作者简介:李俊林(1980-),男,四川南充人,博士,主要研究方向:人工智能、机器学习、数据挖掘;符红光(1965-),男,四川成都人,教授,博士生导师,主要研究方向:计算机代数、自动推理、知识工程。
  • 基金资助:

    国家自然科学基金资助项目(61073099);中央高校基本科研业务费专项资金资助项目(103.1.2 E022050205;ZYGX2009J058)

Applications of molecular-kinetic-theory-based clustering approach on gene expression data

LI Jun-lin, FU Hong-guang   

  1. School of Computer Science and Engineering, University of Electronic Science and Technology of China, Chengdu Sichuan 610054, China
  • Received:2011-03-10 Revised:2011-04-21 Online:2011-10-11 Published:2011-10-01

摘要: 为了识别出可能具有诊断力的特征基因,常常使用聚类的方法对基因表达数据进行分析,而仿分子动理学聚类法通过仿效分子间的作用力机制能达到对数据聚类的目的。仿分子动理学聚类技术不需要预设簇个数,且可用于估计数据中的簇个数。该方法被应用于基因表达数据,结合相关指标用以估计数据中存在的簇个数和发现可能具有诊断力的特征基因。实验与分析结果显示了仿分子动理学聚类技术具有良好的知识挖掘能力。

关键词: 聚类, 分子动理学, 互作用力, 基因表达, 数据挖掘, 知识发现

Abstract: In order to find possible diagnostic genes that may typically assist in disease diagnosis, clustering technologies are always used to analyze gene expression data. Molecular-kinetic-theory-based clustering approach is a new and effective clustering technique. It finds data clusters by following the molecular kinetic mechanism. This dynamic clustering approach does not require presetting the number of clusters and can be used to estimate the number of clusters. The authors applied the method on gene expression data to estimate the number of clusters and possible diagnostic genes according to relevant clustering criteria. The simulation results and analysis verify the good knowledge discovery ability of this approach.

Key words: clustering, molecular kinetics, interaction, gene expression, data mining, knowledge discovery

中图分类号: