%0 Journal Article %A 闵鑫 %A 牟长宁 %A 王海鹏 %T 基于多头注意力机制和残差神经网络的肽谱匹配打分算法 %D 2020 %R 10.11772/j.issn.1001-9081.2019101880 %J 计算机应用 %P 1830-1836 %V 40 %N 6 %X 肽谱匹配打分算法在肽序列鉴定的过程中起着关键性作用,而传统的打分算法无法充分有效地利用肽碎裂规律进行打分。针对这一问题提出了一种结合肽序列信息表征的多分类概率和式打分算法deepScore-α,该算法不需要考虑全局信息进行二次打分,不存在理论质谱与实验质谱相似度计算方法的限制。deepScore-α使用一维残差网络对序列底层信息进行抽取,再通过多头注意力机制融合序列不同肽键位点对当前肽键位点断裂产生的影响从而生成最终的碎片离子相对强度分布概率矩阵,结合肽序列碎片离子的实际相对强度计算出最终的肽谱匹配得分。该算法与常用开源鉴定工具Comet以及MSGF+进行了比较:在人类蛋白组数据集上错误发现率(FDR)为0.01时,deepScore-α保留的肽序列数量提升了约14%,Top1命中率(正确肽序列在得分最高的谱图所占比例)最大提升约5个百分点。使用人类蛋白组数据集训练的模型在ProteomeTools2数据集上进行泛化性能测试,结果表明,在FDR为0.01的条件下deepScore-α保留的肽序列数量提升了约7%,Top1命中率提升了约5个百分点,Top1中来自Decoy库的鉴定结果减少约60%。实验结果证明,deepScore-α在较低FDR值情况下保留更多的肽序列并提升Top1的命中率,且具有较好的泛化性能。 %U http://www.joca.cn/CN/10.11772/j.issn.1001-9081.2019101880