期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于Transformer和门控循环单元的肽序列理论串联质谱图预测方法
何长久, 杨婧涵, 周丕宇, 边昕烨, 吕明明, 董迪, 付岩, 王海鹏
《计算机应用》唯一官方网站    2024, 44 (12): 3958-3964.   DOI: 10.11772/j.issn.1001-9081.2023121846
摘要162)   HTML11)    PDF (1699KB)(60)    收藏

针对现有理论串联质谱图预测仅限于预测b、y主干碎片离子以及单一模型难以捕捉肽序列复杂关系的问题,提出一种基于Transformer和门控循环单元(GRU)的肽序列理论串联质谱图预测方法,名为DeepCollider。首先,通过自注意力机制和长距离依赖关系,使用Transformer和GRU结合的深度学习架构增强对肽序列与碎片离子强度关系的建模能力;其次,与现有方法编码肽序列预测所有b、y主干离子不同,使用碎裂标志位标记肽序列的碎裂位点,从而可针对特定碎裂位点进行编码并预测相应的碎片离子;最后,为了计算预测谱图与实验谱图之间的相似度,使用皮尔逊相关系数(PCC)和平均绝对误差(MAE)作为评测指标。实验结果表明,与现有的仅限预测b、y主干碎片离子的方法(如pDeep和Prosit方法)相比,DeepCollider在PCC和MAE指标上均有优势,PCC值提升了0.15,MAE值降低了0.005。可见,DeepCollider不仅可以预测b、y、a主干离子及其相应的失水失氨中性丢失离子,还可以进一步提高理论谱图预测的谱峰覆盖度和相似性。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于图卷积神经网络的串联质谱从头测序
牟长宁, 王海鹏, 周丕宇, 侯鑫行
计算机应用    2021, 41 (9): 2773-2779.   DOI: 10.11772/j.issn.1001-9081.2020111875
摘要525)      PDF (11373KB)(394)    收藏
在蛋白质组学中从头测序是串联质谱肽段测序的重要方法之一,其具有不依赖于蛋白质数据库的优势,并在测定未知物种蛋白序列、单克隆抗体测序等领域中起着关键作用。然而由于从头测序的复杂性,导致其测序的准确率远低于数据库搜索方法,制约了从头测序的广泛应用。针对从头测序准确率低的问题,提出一种基于图卷积神经网络(GCN)的从头测序方法denovo-GCN。该方法将质谱中谱峰之间的关系用图结构表示,并从每个相应的肽碎裂位点提取谱峰特征,然后通过GCN预测当前碎裂位点处的氨基酸类型,最后逐步组成完整的肽序列。通过实验确定了GCN模型的层数、离子类型组合和测序使用的谱峰数量这3个影响模型的重要参数,并将多个物种数据集用于实验对比。实验结果表明,该方法在肽水平上的召回率比基于图论的从头测序方法Novor、pNovo提高了4.0~21.1个百分点,比基于卷积神经网络(CNN)和长短期记忆(LSTM)网络的DeepNovo提高了2.1~10.7个百分点。
参考文献 | 相关文章 | 多维度评价
3. 基于Transformer和门控循环单元的磷酸化肽从头测序算法
姚理进 张迪 周丕宇 曲志坚 王海鹏
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2025010060
预出版日期: 2025-04-27