计算机应用 ›› 2021, Vol. 41 ›› Issue (10): 3070-3074.DOI: 10.11772/j.issn.1001-9081.2020111752
所属专题: 前沿与综合应用
赖自成, 张玉萍, 马燕
收稿日期:
2020-11-10
修回日期:
2021-02-04
发布日期:
2021-10-27
出版日期:
2021-10-10
通讯作者:
张玉萍
作者简介:
赖自成(1995-),男,江西萍乡人,硕士研究生,主要研究方向:深度强化学习、有机化学反应预测;张玉萍(1963-),女,浙江宁波人,教授,博士,主要研究方向:深度强化学习、人工智能;马燕(1970-),女,上海人,教授,博士,主要研究方向:机器学习、深度强化学习、人工智能。
基金资助:
LAI Zicheng, ZHANG Yuping, MA Yan
Received:
2020-11-10
Revised:
2021-02-04
Online:
2021-10-27
Published:
2021-10-10
Supported by:
摘要: 随着现代医药技术和计算机技术的发展,采用人工智能技术来加速药物的研发进度成为了研究热点,而对有机化学反应产物的高效预测是药物逆合成路线设计中的关键问题。针对样本数据集中化学反应类型分布不均匀的问题,提出了一种主动采样训练下的门控图卷积神经网络(ASGGCN)模型。首先,输入化学反应物的简化分子线性输入规范(SMILES)编码,通过门控图卷积神经网络(GGCN)以及注意力机制预测反应中心所在位置;然后,根据化学约束条件和候选反应中心枚举出可能的化学键组合来生成候选产物,再通过门控图卷积差分网络对候选产物进行筛选;最终,得到反应产物。门控图卷积神经网络拥有三个权重参数矩阵并通过门控对信息加以融合,与传统的图卷积神经网络相比,它能获取更加丰富的原子隐藏特征信息。通过主动采样的方式进行训练,使得该模型能够兼顾较差样本和普通样本的分析能力。实验结果表明,所提模型对化学反应产物的Top-1预测准确率可达87.2%,对比Weisfeiler-Lehman差分网络(WLDN)模型提高了1.6个百分点,可见模型能够更准确地预测有机化学反应产物。
中图分类号:
赖自成, 张玉萍, 马燕. 基于门控图卷积神经网络的有机化学反应预测[J]. 计算机应用, 2021, 41(10): 3070-3074.
LAI Zicheng, ZHANG Yuping, MA Yan. Prediction of organic reaction based on gated graph convolutional neural network[J]. Journal of Computer Applications, 2021, 41(10): 3070-3074.
[1] SUN M Y, ZHAO S D, GILVARY C, et al. Graph convolutional networks for computational drug development and discovery[J]. Briefings in Bioinformatics, 2020, 21(3):919-935. [2] 刘伊迪, 杨骐, 李遥, 等. 机器学习在有机化学中的应用[J]. 有机化学, 2020, 40(11):3812-3827.(LIU Y D, YANG Q, LI Y, et al. Application of machine learning in organic chemistry[J]. Chinese Journal of Organic Chemistry, 2020, 40(11):3812-3827.) [3] 李秉轲, 丛湧, 田之悦, 等. 基于分子描述符和机器学习方法预测和虚拟筛选MMP-13对MMP-1的选择性抑制剂[J]. 物理化学学报, 2014, 30(1):171-182.(LI B K, CONG Y, TIAN Z Y, et al. Predicting and virtually screening the selective inhibitors of MMP-13 over MMP-1 by molecular descriptors and machine learning methods[J]. Acta Physico-Chimica Sinica, 2014, 30(1):171-182.) [4] LIN Y F, ZHANG Z R, MAHJOUR B, et al. Reinforcing the supply chain of COVID-19 therapeutics with expert-coded retrosynthetic software[EB/OL].[2021-01-10]. https://doi.org/10.26434/chemrxiv.12765410.v1. [5] 梁礼, 邓成龙, 张艳敏, 等. 人工智能在药物发现中的应用与挑战[J]. 药学进展, 2020, 44(1):18-27.(LIANG L, DENG C L, ZHANG Y M, et al. Application and challenges of artificial intelligence in drug discovery[J]. Progress in Pharmaceutical Sciences, 2020, 44(1):18-27.) [6] DIMASI J. Research and development costs of new drugs[J]. The Journal of the American Medical Association, 2020, 324(5):No. 517. [7] STOKES J M, YANG K, SWANSON K, et al. A deep learning approach to antibiotic discovery[J]. Cell, 2020, 180(4):688-702. [8] DAI H J, LI C T, COLEY C W, et al. Retrosynthesis prediction with conditional graph logic network[EB/OL].[2021-01-10]. https://arxiv.org/pdf/2001.01408.pdf. [9] SALATIN T D, JORGENSEN W L. Computer-assisted mechanistic evaluation of organic reactions. 1. overview[J]. The Journal of Organic Chemistry, 1980, 45(11):2043-2051. [10] GASTEIGER J, HUTCHINGS M G, CHRISTOPH B, et al. A New Treatment of Chemical Reactivity:Development of EROS, an Expert System for Reaction Prediction and Synthesis Design[M]. Berlin:Springer, 1987:19-73. [11] UGI I, BAUER J, BLEY K, et al. ChemInform abstract:computer supported chemical calculating, thinking, and inventing[J]. ChemInform, 1992, 23(38):170-178. [12] SATOH H, FUNATSU K. SOPHIA, a knowledge base-guided reaction prediction system-utilization of a knowledge base derived from a reaction database[J]. Journal of Chemical Information and Computer Sciences, 1995, 35(1):34-44. [13] SOCORRO I M, TAYLOR K, GOODMAN J M. ROBIA:a reaction prediction program[J]. Organic Letters, 2005, 7(16):3541-3544. [14] COLEY C W, BARZILAY R, JAAKKOLA T S, et al. Prediction of organic reaction outcomes using machine learning[J]. ACS Central Science, 2017, 3(5):434-443. [15] GOH G B, HODAS N, SIEGEL C, et al. SMILES2Vec:an interpretable general-purpose deep neural network for predicting chemical properties[EB/OL].[2020-05-20]. https://arxiv.org/pdf/1712.02034.pdf. [16] SCHWALLER P, GAUDIN T, LÁNYI D, et al. "Found in Translation":predicting outcomes of complex organic chemistry reactions using neural sequence-to-sequence models[J]. Chemical Science, 2018, 9(28):6091-6098. [17] KIPF T N, WELLING M. Semi-supervised classification with graph convolutional networks[EB/OL].[2021-01-10]. https://arxiv.org/pdf/1609.02907.pdf [18] COLEY C W, JIN W G, ROGERS L, et al. A graph-convolutional neural network model for the prediction of chemical reactivity[J]. Chemical Science, 2019, 10(2):370-377. [19] LOWE D. Patent reaction extraction[P/OL].[2018-05-20]. https://doi.org/10.17863/CAM.16293. |
[1] | 侯阳 张琼 赵紫煊 朱正宇 张晓博. 基于YOLOv5s的复杂场景下高效烟火检测算法——YOLOv5s-MRD[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[2] | 张奇业, 曾心蕊. 带高斯核的支持向量数据描述问题的高效积极集法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3808-3814. |
[3] | 黄亚伟, 钱雪忠, 宋威. 基于双档案种群大小自适应方法的改进差分进化算法[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3844-3853. |
[4] | 蒋鸿儒, 方巍. 深度学习在气象数据订正中的应用综述[J]. 《计算机应用》唯一官方网站, 2024, 44(12): 3930-3940. |
[5] | 罗蒙 高超 王震. 基于带约束谱聚类的启发式车辆路径规划算法优化方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[6] | 曹晓意 罗煦琼 李景 贺恩锋. 改进人工势场法下的多无人机编队路径规划方法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[7] | 袁志超 杨磊 田井林 魏晓威 李康顺. 面向复杂约束多目标优化问题的双种群双阶段进化算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[8] | 冷琴, 毛政元. 考虑设施规模决策的两级选址-路径优化[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3513-3520. |
[9] | 彭庆媛, 王晓峰, 王军霞, 华盈盈, 唐傲, 何飞. 可满足性问题相变研究综述[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3503-3512. |
[10] | 黄杰, 武瑞梓, 李均利. 高效的自适应复杂网络鲁棒性优化算法[J]. 《计算机应用》唯一官方网站, 2024, 44(11): 3530-3539. |
[11] | 孙仁科, 皇甫志宇, 陈虎, 李仲年, 许新征. 神经架构搜索综述[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 2983-2994. |
[12] | 孙安泰, 刘烨, 徐冬梅. 多智能体系统的动态面渐近补偿算法[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3151-3157. |
[13] | 颜超英, 张紫仪, 曲映楠, 李秋禹, 郑地翔, 孙丽珺. 基于联盟链的双向拍卖碳交易[J]. 《计算机应用》唯一官方网站, 2024, 44(10): 3240-3245. |
[14] | 杨志龙 邹德旋 李灿 邵莹莹 马乐杰. 融入限制反向学习与柯西-高斯变异的蜣螂优化算法[J]. 《计算机应用》唯一官方网站, 0, (): 0-0. |
[15] | 姚光磊, 熊菊霞, 杨国武. 基于神经网络优化的花朵授粉算法[J]. 《计算机应用》唯一官方网站, 2024, 44(9): 2829-2837. |
阅读次数 | ||||||
全文 |
|
|||||
摘要 |
|
|||||