计算机应用 ›› 2021, Vol. 41 ›› Issue (10): 3070-3074.DOI: 10.11772/j.issn.1001-9081.2020111752
所属专题: 前沿与综合应用
收稿日期:
2020-11-10
修回日期:
2021-02-04
出版日期:
2021-10-10
发布日期:
2021-10-27
通讯作者:
张玉萍
作者简介:
赖自成(1995-),男,江西萍乡人,硕士研究生,主要研究方向:深度强化学习、有机化学反应预测;张玉萍(1963-),女,浙江宁波人,教授,博士,主要研究方向:深度强化学习、人工智能;马燕(1970-),女,上海人,教授,博士,主要研究方向:机器学习、深度强化学习、人工智能。
基金资助:
LAI Zicheng, ZHANG Yuping, MA Yan
Received:
2020-11-10
Revised:
2021-02-04
Online:
2021-10-10
Published:
2021-10-27
Supported by:
摘要: 随着现代医药技术和计算机技术的发展,采用人工智能技术来加速药物的研发进度成为了研究热点,而对有机化学反应产物的高效预测是药物逆合成路线设计中的关键问题。针对样本数据集中化学反应类型分布不均匀的问题,提出了一种主动采样训练下的门控图卷积神经网络(ASGGCN)模型。首先,输入化学反应物的简化分子线性输入规范(SMILES)编码,通过门控图卷积神经网络(GGCN)以及注意力机制预测反应中心所在位置;然后,根据化学约束条件和候选反应中心枚举出可能的化学键组合来生成候选产物,再通过门控图卷积差分网络对候选产物进行筛选;最终,得到反应产物。门控图卷积神经网络拥有三个权重参数矩阵并通过门控对信息加以融合,与传统的图卷积神经网络相比,它能获取更加丰富的原子隐藏特征信息。通过主动采样的方式进行训练,使得该模型能够兼顾较差样本和普通样本的分析能力。实验结果表明,所提模型对化学反应产物的Top-1预测准确率可达87.2%,对比Weisfeiler-Lehman差分网络(WLDN)模型提高了1.6个百分点,可见模型能够更准确地预测有机化学反应产物。
中图分类号:
赖自成, 张玉萍, 马燕. 基于门控图卷积神经网络的有机化学反应预测[J]. 计算机应用, 2021, 41(10): 3070-3074.
LAI Zicheng, ZHANG Yuping, MA Yan. Prediction of organic reaction based on gated graph convolutional neural network[J]. Journal of Computer Applications, 2021, 41(10): 3070-3074.
[1] SUN M Y, ZHAO S D, GILVARY C, et al. Graph convolutional networks for computational drug development and discovery[J]. Briefings in Bioinformatics, 2020, 21(3):919-935. [2] 刘伊迪, 杨骐, 李遥, 等. 机器学习在有机化学中的应用[J]. 有机化学, 2020, 40(11):3812-3827.(LIU Y D, YANG Q, LI Y, et al. Application of machine learning in organic chemistry[J]. Chinese Journal of Organic Chemistry, 2020, 40(11):3812-3827.) [3] 李秉轲, 丛湧, 田之悦, 等. 基于分子描述符和机器学习方法预测和虚拟筛选MMP-13对MMP-1的选择性抑制剂[J]. 物理化学学报, 2014, 30(1):171-182.(LI B K, CONG Y, TIAN Z Y, et al. Predicting and virtually screening the selective inhibitors of MMP-13 over MMP-1 by molecular descriptors and machine learning methods[J]. Acta Physico-Chimica Sinica, 2014, 30(1):171-182.) [4] LIN Y F, ZHANG Z R, MAHJOUR B, et al. Reinforcing the supply chain of COVID-19 therapeutics with expert-coded retrosynthetic software[EB/OL].[2021-01-10]. https://doi.org/10.26434/chemrxiv.12765410.v1. [5] 梁礼, 邓成龙, 张艳敏, 等. 人工智能在药物发现中的应用与挑战[J]. 药学进展, 2020, 44(1):18-27.(LIANG L, DENG C L, ZHANG Y M, et al. Application and challenges of artificial intelligence in drug discovery[J]. Progress in Pharmaceutical Sciences, 2020, 44(1):18-27.) [6] DIMASI J. Research and development costs of new drugs[J]. The Journal of the American Medical Association, 2020, 324(5):No. 517. [7] STOKES J M, YANG K, SWANSON K, et al. A deep learning approach to antibiotic discovery[J]. Cell, 2020, 180(4):688-702. [8] DAI H J, LI C T, COLEY C W, et al. Retrosynthesis prediction with conditional graph logic network[EB/OL].[2021-01-10]. https://arxiv.org/pdf/2001.01408.pdf. [9] SALATIN T D, JORGENSEN W L. Computer-assisted mechanistic evaluation of organic reactions. 1. overview[J]. The Journal of Organic Chemistry, 1980, 45(11):2043-2051. [10] GASTEIGER J, HUTCHINGS M G, CHRISTOPH B, et al. A New Treatment of Chemical Reactivity:Development of EROS, an Expert System for Reaction Prediction and Synthesis Design[M]. Berlin:Springer, 1987:19-73. [11] UGI I, BAUER J, BLEY K, et al. ChemInform abstract:computer supported chemical calculating, thinking, and inventing[J]. ChemInform, 1992, 23(38):170-178. [12] SATOH H, FUNATSU K. SOPHIA, a knowledge base-guided reaction prediction system-utilization of a knowledge base derived from a reaction database[J]. Journal of Chemical Information and Computer Sciences, 1995, 35(1):34-44. [13] SOCORRO I M, TAYLOR K, GOODMAN J M. ROBIA:a reaction prediction program[J]. Organic Letters, 2005, 7(16):3541-3544. [14] COLEY C W, BARZILAY R, JAAKKOLA T S, et al. Prediction of organic reaction outcomes using machine learning[J]. ACS Central Science, 2017, 3(5):434-443. [15] GOH G B, HODAS N, SIEGEL C, et al. SMILES2Vec:an interpretable general-purpose deep neural network for predicting chemical properties[EB/OL].[2020-05-20]. https://arxiv.org/pdf/1712.02034.pdf. [16] SCHWALLER P, GAUDIN T, LÁNYI D, et al. "Found in Translation":predicting outcomes of complex organic chemistry reactions using neural sequence-to-sequence models[J]. Chemical Science, 2018, 9(28):6091-6098. [17] KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL].[2021-01-10]. https://arxiv.org/pdf/1609.02907.pdf [18] COLEY C W, JIN W G, ROGERS L, et al. A graph-convolutional neural network model for the prediction of chemical reactivity[J]. Chemical Science, 2019, 10(2):370-377. [19] LOWE D. Patent reaction extraction[P/OL].[2018-05-20]. https://doi.org/10.17863/CAM.16293. |
[1] | 肖智豪 胡志华 朱琳. 求解冷链物流时间依赖型车辆路径问题的混合自适应大邻域搜索算法[J]. 计算机应用, 0, (): 0-0. |
[2] | 沙林秀,聂凡,高倩,孟号. 基于布朗运动与梯度信息的交替优化算法[J]. 计算机应用, 0, (): 0-0. |
[3] | 董永峰 孙跃华 高立超 韩鹏 季海鹏. 基于改进一维卷积和双向长短期记忆神经网络的故障诊断方法[J]. 计算机应用, 0, (): 0-0. |
[4] | 李大海 刘庆腾 艾志刚 王振东. 基于动态D向分割和混沌扰动的阴阳对算法[J]. 计算机应用, 0, (): 0-0. |
[5] | 雷鹰 郑万波 魏嵬 夏云霓 李晓波 刘诚武 谢洪. 基于概率性能感知演化博弈策略的混合“云+边”环境中任务卸载方法 [J]. 计算机应用, 0, (): 0-0. |
[6] | 乔钢柱 王瑞 孙超利. 基于分解的高维多目标改进进化算法[J]. 计算机应用, 0, (): 0-0. |
[7] | 朱诚 潘旭华 张勇. 基于趋化校正的哈里斯鹰优化算法[J]. 计算机应用, 0, (): 0-0. |
[8] | 陈俊, 何庆. 基于余弦相似度的改进蝴蝶优化算法[J]. 计算机应用, 2021, 41(9): 2668-2677. |
[9] | 平凡 汤小春 潘彦宇 李战怀. 不规则任务在图形处理器集群上的调度策略[J]. 计算机应用, 0, (): 0-0. |
[10] | 杨杰 张名扬 芮晓彬 王志晓. 融合节点覆盖范围和结构洞的影响力最大化算法[J]. 计算机应用, 0, (): 0-0. |
[11] | 汤安迪, 韩统, 徐登武, 谢磊. 混沌精英哈里斯鹰优化算法[J]. 计算机应用, 2021, 41(8): 2265-2272. |
[12] | 李蒙蒙, 秦伟, 刘艺, 刁兴春. 结合头脑风暴优化的混合蚁群优化算法[J]. 计算机应用, 2021, 41(8): 2412-2417. |
[13] | 张闻强, 邢征, 杨卫东. 基于多区域采样策略的混合粒子群优化求解多目标柔性作业车间调度问题[J]. 计算机应用, 2021, 41(8): 2249-2257. |
[14] | 党伟超, 李涛, 白尚旺, 高改梅, 刘春霞. 基于自注意力长短期记忆网络的Web软件系统实时剩余寿命预测方法[J]. 计算机应用, 2021, 41(8): 2346-2351. |
[15] | 张祥飞, 鲁宇明, 张平生. 基于协同进化的约束多目标优化算法[J]. 计算机应用, 2021, 41(7): 2012-2018. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||