计算机应用 ›› 2012, Vol. 32 ›› Issue (05): 1488-1490.

• 典型应用 • 上一篇    

基于肽序列标签的蛋白质翻译后修饰中的过滤算法

李文军1,2,徐云1,2,邵明芝1,2   

  1. 1. 安徽省高性能计算重点实验室,合肥 230026
    2. 中国科学技术大学 计算机科学与技术学院,合肥 230026
  • 收稿日期:2011-09-21 修回日期:2011-11-18 发布日期:2012-05-01 出版日期:2012-05-01
  • 通讯作者: 李文军
  • 作者简介:李文军(1978-),男,安徽淮南人,硕士研究生,主要研究方向:生物信息学、并行计算;徐云(1965-),男,安徽合肥人,副教授,博士,主要研究方向:网络计算、并行算法、生物信息学;邵明芝(1984-),女,山东潍坊人,硕士,主要研究方向:生物信息学、并行计算。
  • 基金资助:

    国家自然科学基金重点项目(60533020)

Filtering algorithm based on peptide sequence tags in identification of post translational modification of proteins

LI Wen-jun1,2,XU Yun1,2,SHAO Ming-zhi1,2   

  1. 1. Anhui Province Key Laboratory of High Performance Computing, Hefei Anhui 230026, China
    2. School of Computer Science and Technology, University of Science and Technology of China, Hefei Anhui 230026, China
  • Received:2011-09-21 Revised:2011-11-18 Online:2012-05-01 Published:2012-05-01
  • Contact: LI Wen-jun

摘要: 大量的质谱数据无法被鉴定或是鉴定的精度不够高,特别是在肽段数据库较大时,普通的算法精度下降很快。提出一种新的盲搜索算法,此算法基于一种全新的基于相似关系度量的打分模型。为了处理大规模问题,同时还应用了基于母离子质量和肽序列标签的前过滤方法,使得此算法在较大规模的数据库上精度得到很好的保证。实验结果表明,对于规模为10000, 20000, 50000的肽段数据库,其鉴定准确率分别为78.3%,74.2%,65.5%。随着数据库规模的增大,算法的鉴定准确率保持得较好。

关键词: 肽序列标签, 翻译后修饰, 质谱, 盲搜索, 大规模

Abstract: Lots of spectrum data can not be identified or identified with low accuracy, especially in the case of large scale database, the former algorithm loses accuracy fastly. This paper presented a new blind search algorithm. This algorithm is based on a kind of brand-new score model based on similarity relationship measurement.For large scale question, the agorithm takes two pre-filtering strategies such as parention mass filtering and Peptide Sequence Tags (PST) filtering, so that it can guarantee the accurancy in large scale question.

Key words: Peptide Sequence Tag (PST), Post Translation Modification (PTM), tandem mass spectrum (MS/MS), blind search, large scale

中图分类号: