摘要
良好的先导化合物对于药物研发具有深远影响,可以提高药物上市的成功率。利用传统方法发现先导化合物存在成本高且耗时的问题,而人工智能(artificial intelligence,AI)可以高效发现良好的先导化合物。本文系统地总结了通过人工智能的筛选模型与生成模型获得先导化合物的研究进展,按照输入信息的类型归纳整理不同的模型,重点介绍了利用筛选模型实现药物重定位和利用生成模型实现多目标药物设计,探讨了人工智能在先导化合物研究领域的发展前景,为人工智能在先导化合物方面的应用提供新的研究思路。
药物研发是一个复杂且曲折的过程,在很多阶段都存在失败的可能性。药物科学家往往需要花费十余年的时间,耗费数十亿美元,才可能成功上市一个药
近年来人工智能(AI)应用于药物研发的各个环节(见

图1 人工智能(AI)在药物研发过程中的应用
在先导化合物的发现研究中,人工智能模型主要分为两大类:筛选模型和生成模型。筛选模型能快速且低成本地从海量化合物中筛选出良好的先导化合物,生成模型能生成结构新颖且符合要求的先导化合物,并且模型的命中率较传统模型有明显的提高。因此,借助人工智能模型发现先导化合物成为研究的新方向。本文汇总了近几年用于筛选与生成先导化合物的人工智能模型,按照输入信息的类型归纳不同的模型,总结目前人工智能模型发现先导化合物的发展方向,并进行了展望,期望能为该领域的研究人员提供研究思路上的启发。
筛选模型能针对特定靶点从海量化合物中筛选出理想的先导化合物。根据输出结果,筛选模型分为分类模型和回归模型。分类模型和回归模型的构建流程见

图2 分类模型和回归模型的构建流程图
分类模型能定性预测化合物与靶点是否有良好的相互作用。分类模型主要是基于机器学习的模型,常见的机器学习模型有支持向量机(support vector machine,SVM)、随机森林(random forest, RF)、贝叶斯、XGBoost和深度学习
化合物的定量构-效关系(QSAR)信息和分子指纹是常见的分类模型输入方式。Xie
深度学习模型是机器学习模型的一种,其中的卷积神经网络(convolutional neural network,CNN)是擅长处理图像的经典分类模型,利用卷积操作提取特征信息的原理见

图3 CNN中卷积操作提取特征信息的原理图
化合物分子的像素图片作为模型的输入方式存在一定的不足:一是像素图片中化学键的长短和粗细影响模型的训练结果;二是像素图片的清晰度也会影响模型的分类性能。而图卷积网络(graph convolutional network,GCN)既避免像素图片表示化合物的不足,也利用卷积操作强大的特征提取能力。图卷积网络是把化合物分子中的原子和化学键分别编码表示成图片中的“节点”和“连接节点的边”,在节点级别上提取特征信息并使用邻接矩阵对相邻节点上提取的信息进行整
将图卷积表示的化合物相关信息和靶点的相关信息进行整合,可以输入到分类模型,定性评价药物与靶点之间的相互作用。Peng
简化分子线性输入规范(simplified molecular-input line-entry system,SMILES)序列也是一种常用的化合物分子表示方式,是将分子中的非氢原子和相关化学键按照一定的顺序排列并表示成序
上海科技大学白芳课题组提出以GCN为基础的DeepPROTACs模型,预测所设计的PROTACs分子对靶蛋白的降解效
除了利用分类模型定性地判断化合物与靶点蛋白是否有良好的相互作用并筛选先导化合物,药物化学家利用回归模型可以预测化合物与靶点蛋白之间亲和力的具体数值,也可以预测化合物的理化性质以及ADMET性质的具体数值,将预测值作为筛选先导化合物的判断依据。下面将按照输入方式和用途对回归模型进行分类归纳。
RF-Score是预测化合物-蛋白质亲和力的经典模型。RF-Score采用蛋白质-化合物的原子对计数,即定义4种蛋白质原子(C、N、O和S)和9种化合物原子(C、N、O、S、P、F、Cl、Br和I),在一定原子间距离阈值内统计蛋白质-化合物原子对出现的次数,将统计结果与标签值(亲和力)一起作为输入,训练模型,最终得到预测复合物亲和力的定量预测模
化合物的一维SMILES序列和蛋白质的一维氨基酸序列输入到回归模型中预测化合物-蛋白质的亲和力。Ozturk
化合物的二维分子图作为回归模型的输入方式用于亲和力预测。Nguyen
Krasoulis
一维卷积操作处理序列信息,二维卷积操作处理二维图(像素图或者分子图),而三维卷积操作实现对化合物和蛋白质的三维结构进行特征提取。3D-CNN是将复合物置于三维网格中,通过卷积的方式提取特征并将特征信息输入网络。Ragoza
在先导化合物的研究中,不仅关注化合物与靶点蛋白质之间的相互作用,还关注化合物的吸收、分布、代谢、排泄和毒性(ADMET)性质。较差的ADMET性质是导致药物研发后期失败的原因,因此利用回归模型预测ADMET性质也是目前的研究热点。拜耳公司利用化合物在体外/体内的实验数据和合适的化合物描述方式训练深度神经网络,预测化合物的ADMET性质,助力药物的后期研
筛选模型不仅可以从海量的化合物中筛选出先导化合物,也可以从上市药物或通过临床Ⅰ期的候选药物中筛选出针对其他疾病相关靶点的先导化合物。从上市药物和候选药物中得到先导化合物的方法称为药物重定位(又被称为“老药新用”)。药物重定位最明显的作用是在面对突然暴发的传染病且无药可用时,能快速得到有治疗效果且毒性较小的化合物。2020年新型冠状病毒肆虐全球,由此引起的疫情造成全球死亡人数剧增。为了快速得到能治疗新型冠状病毒感染且安全的化合物,药物化学家利用人工智能筛选模型从“老药”中筛选对新型冠状病毒有良好的抑制作用的先导化合
筛选模型筛选得到的先导化合物可以直接购买,但是购买的化合物分子存在结构新颖性低,不容易突破专利壁垒等问题。而利用生成模型生成新颖结构的化合物分子,拓展化合物化学空间,避开结构专利壁垒,因此生成模型成为人工智能用于先导化合物发现研究的主要模

图4 生成模型的构建流程图
在生成模型的评价指标中,Inception score(IS)和Fréchet inception distance(FID)用来评价生成模型的性能。IS反映生成化合物分子的多样性,值越大表明生成的化合物分子具有更好的多样性。FID反映生成的化合物分子与真实的化合物分子在特征空间的距离,值越小表明生成的化合物分子的相关特征越接近于真实的化合物分子。可合成性和类药性主要评价具体生成的化合物分子,可合成性反映合成化合物分子的难易程度,类药性反映化合物分子是否具有成为药物的可能。
生成模型大致可以分为4类:循环神经网络(recurrent neural network,RNN)、强化学习(reinforcement learning,RL)、自编码器(autoencoder)和生成对抗网络(generative adversarial network,GAN
化合物的SMILES序列可以输入到RNN、RL和自编码器等生成模型中,用于生成结构新颖的化合物分子。RNN会对前面输入的信息进行记忆并应用于当前的计算中,因此擅长处理自然语言以及序列信息,其处理序列信息的机制见

图5 RNN处理序列信息的示意图
RL模型在获取样本数据的同时完成模型的更新并利用当前的模型指导下一步行动,使得模型不断迭代重复直到收敛。阿斯利康公司Olivecrona
中山大学杨跃东课题组利用生成模型设计靶向含溴结构域蛋白4(BRD4)的PROTACs分
自编码器采用编码-解码的方式训练模型,编码部分是将输入序列表示为带有语义的向量,解码部分是将编码生成的向量解码成目标文本序列,所以自编码器本质上是一个自然语言模型。自编码器的编码-解码过程示意图见

图6 自编码器的编码-解码过程示意图
Wang
SMILES序列虽然广泛应用于生成模型并能成功得到新颖的化合物分子,但存在一定的不足。生成模型不会关注SMILES序列的语法规则,导致大多新生成的序列不能表示为分子,需要对新生成的序列进行化学语法和原子排序的鉴别或者人工审查,才能得到正确的SMILES序列。
二维分子图作为输入方式,使生成模型完全生成有效的化合物分子,避免输入SMILES序列所引起的语法问题。因此越来越多的生成模型通过输入二维分子图训练模型,并生成结构新颖的化合物二维分子图。
Khemchandani
GAN是可以生成二维分子图的生成模型,包含生成器和判别器。生成器生成与原始数据相似的数据信息,判别器判别给定的数据信息是否真实。经过交替优化训练,使GAN模型性能整体得到提升,最终GAN模型生成表示化合物结构的二维分子图。GAN模型生成二维分子图的流程见

图7 GAN模型生成二维分子图的流程示意图
上述生成模型都只是以化合物的SMILES序列(一维)信息和分子图(二维)信息作为输入和输出方式,没有关注化合物的三维结构信息以及靶点蛋白质的相关信息。化合物产生药理活性的本质是化合物与靶点蛋白在三维空间中结合从而改变靶点蛋白的生理活性,因此化合物和靶点蛋白的三维信息对于生成新颖结构的化合物分子起到重要作用。浙江大学侯廷军课题组提出一种以蛋白质-配体复合物的三维结合构象作为输入、基于自编码器的分子生成模型RELATIO
Ragoza
在先导化合物发现研究中,不仅只关注化合物的药理活性,还兼顾化合物的其他性质,例如可合成性、类药性和ADMET性质等。因此可以根据输入的化合物信息构建能兼顾并优化多个分子性质的生成模型,得到满足条件的化合物分子。侯廷军课题组提出了一种集知识蒸馏、条件Transformer和强化学习于一体的多约束分子生成模型MCMG,用于生成同时具有理想理化性质和药理活性的新颖结构化合物分
基于多目标要求的生成模型是目前人工智能模型应用于先导化合物发现研究的热点,但是如何选取合适的指标来描述化合物的目标性质和调节指标对模型的影响程度是构建多目标要求的生成模型需要重点解决的问题。
通过生成模型生成的满足多目标要求的先导化合物往往需要通过合成获得,而化合物结构的新颖性会影响化合物合成进度。目前,有多种人工智能模型可以预测化合物的合成路线和合成条件,提高化合物的合成效
合适的先导化合物对于药物的整个研发周期具有重要意义,而高通量筛选和组合化学等传统方法不适合大规模筛选先导化合物,也不太适合设计结构新颖的先导化合物。人工智能助力于先导化合物的研究并取得令人满意的结果。本文总结了近几年用于先导化合物发现研究的筛选模型和生成模型,并按照输入信息类型的不同对每类模型进行整理,突出模型的特点和实际应用。
在先导化合物的研究中,筛选模型和生成模型具有各自的优势。筛选模型可以快速从化合物库中找到合适的先导化合物进行后续研究。更重要的是,筛选模型可以用于“药物重定位”研究,快速得到对重大卫生传染病有治疗效果且安全的药物。例如2020年新型冠状病毒感染疫情暴发,筛选模型快速地从“老药”中得到对新冠疫情有治疗作用的化合物进行研究,推进针对新型冠状病毒的药物研发。生成模型能生成结构新颖且抑制活性良好的化合物分子,并且可以设计满足多目标要求的化合物分子,比筛选模型得到的先导化合物更适合进行后续研究。就化合物新颖性而言,生成模型更具有研究意义。
从利用人工智能模型筛选或者生成满足单一需求的化合物,到利用生成模型设计并得到同时满足药理活性和ADMET性质等多个目标要求的化合物分子,体现了人工智能模型在先导化合物研究中的重要性。在设计得到满足多目标要求化合物分子的研究中,需要选择合适的描述指标体现生成分子的相关性质。例如在药物的ADMET性质中,每一个性质都包含多种描述指标,如何选择合适的指标表示化合物分子的相关性质,是设计满足多目标要求化合物分子的研究重点。目前,研究人员尝试使用知识蒸馏等方法寻找合适的描述指
目前,利用人工智能模型设计得到的化合物进入了临床研究并取得令人满意的结果。前文介绍英矽智能利用人工智能模型设计并合成出结构新颖的DDR1抑制剂,在短时间内完成了临床试验前的全部研


References
Smietana K, Siatkowski M, Møller M. Trends in clinical success rates[J]. Nat Rev Drug Discov, 2016, 15(6): 379-380. [百度学术]
DiMasi JA, Grabowski HG, Hansen RW. The cost of drug development[J]. N Engl J Med, 2015, 372(20): 1972. [百度学术]
Schirle M, Jenkins JL. Identifying compound efficacy targets in phenotypic drug discovery[J]. Drug Discov Today, 2016, 21(1): 82-89. [百度学术]
Mak KK, Pichika MR. Artificial intelligence in drug development: present status and future prospects[J]. Drug Discov Today, 2019, 24(3): 773-780. [百度学术]
Chen HM, Engkvist O, Wang YH, et al. The rise of deep learning in drug discovery[J]. Drug Discov Today, 2018, 23(6): 1241-1250. [百度学术]
Rifaioglu AS, Atas H, Martin MJ, et al. Recent applications of deep learning and machine intelligence on in silico drug discovery: methods, tools and databases[J]. Brief Bioinform, 2019, 20(5): 1878-1912. [百度学术]
Jumper J, Evans R, Pritzel A, et al. Highly accurate protein structure prediction with AlphaFold[J]. Nature, 2021, 596(7873): 583-589. [百度学术]
Baek M, DiMaio F, Anishchenko I, et al. Accurate prediction of protein structures and interactions using a three-track neural network[J]. Science, 2021, 373(6557): 871-876. [百度学术]
Raies A, Tulodziecka E, Stainer J, et al. DrugnomeAI is an ensemble machine-learning framework for predicting druggability of candidate drug targets[J]. Commun Biol, 2022, 5(1): 1291. [百度学术]
Luo FL, Wang MH, Liu Y, et al. DeepPhos: prediction of protein phosphorylation sites with deep learning[J]. Bioinformatics, 2019, 35(16): 2766-2773. [百度学术]
Du HY, Jiang DJ, Gao JB, et al. Proteome-wide profiling of the covalent-druggable cysteines with a structure-based deep graph learning network[J]. Research, 2022, 2022: 9873564. [百度学术]
Patel L, Shukla T, Huang XZ, et al. Machine learning methods in drug discovery[J]. Molecules, 2020, 25(22): 5277. [百度学术]
Xie QQ, Zhong L, Pan YL, et al. Combined SVM-based and docking-based virtual screening for retrieving novel inhibitors of c-Met[J]. Eur J Med Chem, 2011, 46(9): 3675-3680. [百度学术]
Chen JJF, JrVisco DP. Developing an in silico pipeline for faster drug candidate discovery: virtual high throughput screening with the Signature molecular descriptor using support vector machine models[J]. Chem Eng Sci, 2017, 159: 31-42. [百度学术]
Chen JJF, JrVisco DP. Identifying novel factor XIIa inhibitors with PCA-GA-SVM developed vHTS models[J]. Eur J Med Chem, 2017, 140: 31-41. [百度学术]
Singh H, Singh S, Singla D, et al. QSAR based model for discriminating EGFR inhibitors and non-inhibitors using Random forest[J]. Biol Direct, 2015, 10: 10. [百度学术]
Prathipati P, Ma NL, Keller TH. Global Bayesian models for the prioritization of antitubercular agents[J]. J Chem Inf Model, 2008, 48(12): 2362-2370. [百度学术]
Tuerkova A, Bongers BJ, Norinder U, et al. Identifying novel inhibitors for hepatic organic anion transporting polypeptides by machine learning-based virtual screening[J]. J Chem Inf Model, 2022, 62(24): 6323-6335. [百度学术]
Xu YQ, Chen PP, Lin XH, et al. Discovery of CDK4 inhibitors by convolutional neural networks[J]. Future Med Chem, 2019, 11(3): 165-177. [百度学术]
Duvenaud D, Maclaurin D, Aguilera-Iparraguirre J, et al. Convolutional networks on graphs for learning molecular fingerprints[C]//Proceedings of the 28th International Conference on Neural Information Processing Systems - Volume 2. New York: ACM, 2015: 2224-2232. [百度学术]
Peng JJ, Wang YX, Guan JJ, et al. An end-to-end heterogeneous graph representation learning-based framework for drug-target interaction prediction[J]. Brief Bioinform, 2021, 22(5): bbaa430. [百度学术]
Shao KH, Zhang YH, Wen YQ, et al. DTI-HETA: prediction of drug-target interactions based on GCN and GAT on heterogeneous graph[J]. Brief Bioinform, 2022, 23(3): bbac109. [百度学术]
Wu YF, Gao M, Zeng M, et al. BridgeDPI: a novel Graph Neural Network for predicting drug-protein interactions[J]. Bioinformatics, 2022, 38(9): 2571-2578. [百度学术]
Tsubaki M, Tomii K, Jun SS. Compound-protein interaction prediction with end-to-end learning of neural networks for graphs and sequences[J]. Bioinformatics, 2019, 35(2): 309-318. [百度学术]
Weininger D. SMILES, a chemical language and information system. 1. Introduction to methodology and encoding rules[J]. J Chem Inf Comput Sci, 1988, 28(1): 31-36. [百度学术]
Zhang YF, Wang XG, Kaushik AC, et al. SPVec: a Word2Vec-inspired feature representation method for drug-target interaction prediction[J]. Front Chem, 2019, 7: 895. [百度学术]
Xu YQ, Yao HQ, Lin KJ. An overview of neural networks for drug discovery and the inputs used[J]. Expert Opin Drug Discov, 2018, 13(12): 1091-1102. [百度学术]
Li FL, Hu QY, Zhang XL, et al. DeepPROTACs is a deep learning-based targeted degradation predictor for PROTACs[J]. Nat Commun, 2022, 13(1): 7133. [百度学术]
Ballester PJ, Mitchell JB. A machine learning approach to predicting protein-ligand binding affinity with applications to molecular docking[J]. Bioinformatics, 2010, 26(9): 1169-1175. [百度学术]
Sánchez-Cruz N, Medina-Franco JL, Mestres J, et al. Extended connectivity interaction features: improving binding affinity prediction through chemical description[J]. Bioinformatics, 2021, 37(10): 1376-1382. [百度学术]
Öztürk H, Özgür A, Ozkirimli E. DeepDTA: deep drug-target binding affinity prediction[J]. Bioinformatics, 2018, 34(17): i821-i829. [百度学术]
Hua Y, Song XN, Feng ZH, et al. MFR-DTA: a multi-functional and robust model for predicting drug-target binding affinity and region[J]. Bioinformatics, 2023, 39(2): btad056. [百度学术]
Nguyen T, Le H, Quinn TP, et al. GraphDTA: predicting drug-target binding affinity with graph neural networks[J]. Bioinformatics, 2021, 37(8): 1140-1147. [百度学术]
Yang ZD, Zhong WH, Zhao L, et al. MGraphDTA: deep multiscale graph neural network for explainable drug-target binding affinity prediction[J]. Chem Sci, 2022, 13(3): 816-833. [百度学术]
Krasoulis A, Antonopoulos N, Pitsikalis V, et al. DENVIS: scalable and high-throughput virtual screening using graph neural networks with atomic and surface protein pocket features[J]. J Chem Inf Model, 2022, 62(19): 4642-4659. [百度学术]
Ragoza M, Hochuli J, Idrobo E, et al. Protein-ligand scoring with convolutional neural networks[J]. J Chem Inf Model, 2017, 57(4): 942-957. [百度学术]
Hochuli J, Helbling A, Skaist T, et al. Visualizing convolutional neural network protein-ligand scoring[J]. J Mol Graph Model, 2018, 84: 96-108. [百度学术]
Jiménez J, Škalič M, Martínez-Rosell G, et al. KDEEP: protein-ligand absolute binding affinity prediction via 3D-convolutional neural networks[J]. J Chem Inf Model, 2018, 58(2): 287-296. [百度学术]
Göller AH, Kuhnke L, Montanari F, et al. Bayer's in silico ADMET platform: a journey of machine learning over the past two decades[J]. Drug Discov Today, 2020, 25(9): 1702-1709. [百度学术]
Mayr A, Klambauer G, Unterthiner T, et al. DeepTox: toxicity prediction using deep learning[J]. Front Environ Sci, 2016, 3: 80. [百度学术]
Xiong GL, Wu ZX, Yi JC, et al. ADMETlab 2.0: an integrated online platform for accurate and comprehensive predictions of ADMET properties[J]. Nucleic Acids Res, 2021, 49(W1): W5-W14. [百度学术]
Lu L, Qin JL, Chen JD, et al. Recent computational drug repositioning strategies against SARS-CoV-2[J]. Comput Struct Biotechnol J, 2022, 20: 5713-5728. [百度学术]
Su XR, Hu L, You ZH, et al. A deep learning method for repurposing antiviral drugs against new viruses via multi-view nonnegative matrix factorization and its application to SARS-CoV-2[J]. Brief Bioinform, 2022, 23(1): bbab526. [百度学术]
Zeng XX, Song X, Ma TF, et al. Repurpose open data to discover therapeutics for COVID-19 using deep learning[J]. J Proteome Res, 2020, 19(11): 4624-4636. [百度学术]
Zeng XX, Wang F, Luo Y, et al. Deep generative molecular design reshapes drug discovery[J]. Cell Rep Med, 2022, 3(12): 100794. [百度学术]
Xu YJ, Lin KJ, Wang SW, et al. Deep learning for molecular generation[J]. Future Med Chem, 2019, 11(6): 567-597. [百度学术]
Tong XC, Liu XH, Tan XQ, et al. Generative models for de novo drug design[J]. J Med Chem, 2021, 64(19): 14011-14027. [百度学术]
Li XY, Xu YQ, Yao HQ, et al. Chemical space exploration based on recurrent neural networks: applications in discovering kinase inhibitors[J]. J Cheminform, 2020, 12(1): 42. [百度学术]
Segler MHS, Kogej T, Tyrchan C, et al. Generating focused molecule libraries for drug discovery with recurrent neural networks[J]. ACS Cent Sci, 2018, 4(1): 120-131. [百度学术]
Olivecrona M, Blaschke T, Engkvist O, et al. Molecular de-novo design through deep reinforcement learning[J]. J Cheminform, 2017, 9(1): 48. [百度学术]
Popova M, Isayev O, Tropsha A. Deep reinforcement learning for de novo drug design[J]. Sci Adv, 2018, 4(7): eaap7885. [百度学术]
Zhavoronkov A, Ivanenkov YA, Aliper A, et al. Deep learning enables rapid identification of potent DDR1 kinase inhibitors[J]. Nat Biotechnol, 2019, 37(9): 1038-1040. [百度学术]
Zheng SJ, Tan YH, Wang ZY, et al. Accelerated rational PROTAC design via deep learning and molecular simulations[J]. Nat Mach Intell, 2022, 4(9): 739-748. [百度学术]
Gómez-Bombarelli R, Wei JN, Duvenaud D, et al. Automatic chemical design using a data-driven continuous representation of molecules[J]. ACS Cent Sci, 2018, 4(2): 268-276. [百度学术]
Polykovskiy D, Zhebrak A, Vetrov D, et al. Entangled conditional adversarial autoencoder for de novo drug discovery[J]. Mol Pharm, 2018, 15(10): 4398-4405. [百度学术]
Wang JK, Wang XR, Sun HY, et al. ChemistGA: a chemical synthesizable accessible molecular generation algorithm for real-world drug discovery[J]. J Med Chem, 2022, 65(18): 12482-12496. [百度学术]
Khemchandani Y, O'Hagan S, Samanta S, et al. DeepGraphMolGen, a multi-objective, computational strategy for generating molecules with desirable properties: a graph convolution and reinforcement learning approach[J]. J Cheminform, 2020, 12(1): 53. [百度学术]
Maziarka Ł, Pocha A, Kaczmarczyk J, et al. Mol-CycleGAN: a generative model for molecular optimization[J]. J Cheminform, 2020, 12(1): 2. [百度学术]
Wang MY, Hsieh CY, Wang JK, et al. RELATION: a deep generative model for structure-based de novo drug design[J]. J Med Chem, 2022, 65(13): 9478-9492. [百度学术]
Ragoza M, Masuda T, Koes DR. Generating 3D molecules conditional on receptor binding sites with deep generative models[J]. Chem Sci, 2022, 13(9): 2701-2713. [百度学术]
Wang JK, Hsieh CY, Wang MY, et al. Multi-constraint molecular generation based on conditional transformer, knowledge distillation and reinforcement learning[J]. Nat Mach Intell, 2021, 3(10): 914-922. [百度学术]
Li YB, Zhang LR, Liu ZM. Multi-objective de novo drug design with conditional graph generative model[J]. J Cheminform, 2018, 10(1): 33. [百度学术]
Segler MHS, Preuss M, Waller MP. Planning chemical syntheses with deep neural networks and symbolic AI[J]. Nature, 2018, 555(7698): 604-610. [百度学术]
Ishida S, Terayama K, Kojima R, et al. Prediction and interpretable visualization of retrosynthetic reactions using graph convolutional networks[J]. J Chem Inf Model, 2019, 59(12): 5026-5033. [百度学术]
Schwaller P, Petraglia R, Zullo V, et al. Predicting retrosynthetic pathways using transformer-based models and a hyper-graph exploration strategy[J]. Chem Sci, 2020, 11(12): 3316-3325. [百度学术]
Yuan WN, Chen GX, Chen CYC. FusionDTA: attention-based feature polymerizer and knowledge distillation for drug-target binding affinity prediction[J]. Brief Bioinform, 2022, 23(1): bbab506. [百度学术]
Goebel L, Müller MP, Goody RS, et al. KRas