Optimization of Menin inhibitors based on artificial intelligence-driven molecular factory technology
-
摘要:
以深度学习为代表的新一代人工智能技术已经成为推动新药研发的重要驱动力。本文创造性地提出了一种基于人工智能技术的创新药物分子设计和优化工作流程“分子工厂”,该流程融合了自主研发的智能分子生成模型、高性能分子对接算法以及高精度亲和力预测方法,已作为核心模块被整合进一站式药物设计软件平台DrugFlow,为先导化合物发现和优化提供了一整套成熟的解决方案。利用“分子工厂”模块,针对Menin蛋白开展了抗耐药第2代抑制剂的研发。通过计算和实验的结合,快速获得多个潜力化合物,其中化合物RG-10对Menin野生型、M327I突变体和T349M突变体的IC50分别为9.681 nmol/L、233.2 nmol/L和40.09 nmol/L;与已进入Ⅱ期临床的阳性参照分子SNDX-5613相比,其对M327I和T349M突变体的抑制活性显著提升。上述研究充分展现了“分子工厂”技术在新药研发项目中的独特优势,能快速高效地针对特定蛋白结构产生高质量的活性分子,对推动新药研发具有重大价值和深远意义。
Abstract:The new generation of artificial intelligence technology, represented by deep learning, has emerged as a crucial driving force in the advancement of new drug research and development. This article creatively proposes a workflow named “Molecular Factory” for the design and optimization of drug molecules based on artificial intelligence technology. This workflow integrates intelligent molecular generation models, high-performance molecular docking algorithms, and accurate protein-ligand binding affinity prediction methods. It has been integrated as a core module into DrugFlow, a one-stop drug design software platform, providing a comprehensive set of mature solutions for the discovery and optimization of lead compounds. Utilizing the “Molecular Factory” module, we conducted the research of second-generation inhibitors against Menin that can combat drug resistance. Through the integration of computational and experimental approaches, we rapidly identified multiple promising compounds. Among them, compound RG-10 exhibited the IC50 values of 9.681 nmol/L, 233.2 nmol/L, and 40.09 nmol/L against the wild-type Menin, M327I mutant, and T349M mutant, respectively. Compared to the positive reference molecule SNDX-5613, which has entered Phase II clinical trials, RG-10 demonstrated significantly enhanced inhibitory activity against the M327I and T349M mutants. These findings fully demonstrate the unique advantages of the "Molecular Factory" technology in practical drug design and development scenarios. It can rapidly and efficiently generate high-quality active molecules targeting specific protein structures, holding significant value and profound implications for advancing new drug discovery.
-
Menin是一种关键的染色质衔接蛋白,对于染色质上多种蛋白复合体的形成与稳定起着至关重要的作用。这些蛋白复合体包括MLL1和MLL2甲基转移酶复合体以及 JUND 转录因子复合体等[1]。Menin是针对由MLL1和NPM1突变驱动的急性白血病开发药物的关键靶点,破坏Menin与MLL 的相互作用能够抑制 MLL基因重排以及 NPM1 突变引起的白血病细胞生长。在急性淋巴细胞白血病中,约80%的病例出现了KMT2A(MLL)突变;而在急性髓系、淋巴样或混合表型白血病中,约30%病例中KMT2A突变与NPM1突变共存。最新研究发现,针对Menin的治疗对FLT3突变型白血病也具有显著效果。在NPM1突变型和MLL重排型白血病中,通过抑制Menin-MLL相互作用并靶向MEIS1转录因子,可以有效抑制FLT3突变。因此,Menin-MLL和FLT3的联合抑制为伴有FLT3突变的白血病患者提供了一个协同治疗的新机会[2]。
Menin小分子抑制剂的研发已成为近年来的热门领域,已进入临床的化合物结构如图1所示。近期,由Syndax Pharmaceuticals公司研发的Menin抑制剂revumenib(又名SNDX-5613)在临床试验中取得积极结果,其针对携带MLL1或NPM1突变的复发性或难治性急性白血病患者。美国食品药品监督管理局(FDA)已将revumenib授予突破性疗法认定。在Ⅰ/Ⅱ期临床试验中,针对MLL1或NPM1突变的急性白血病患者的总体反应率达到了53%,其中30%的患者实现了完全或部分的血液学缓解与恢复。然而,在Ⅰ期临床试验中观察到,虽然患者最初对Menin抑制剂有反应,但随后可能会出现耐药性。研究发现,约38.7%的患者携带至少1个MEN1基因点突变[3−4]。由此可见,针对revumenib产生耐药的Menin突变开发第2代抗耐药Menin抑制剂极为迫切。
新药研发是一项非常复杂系统工程,投入高、周期长、风险大。近年来,随着计算机运算能力的显著提升、智能算法的快速发展以及实验数据的不断累积,以深度学习(deep learning, DL)为代表的人工智能(Artificial Intelligence,AI)技术被逐步应用到新药研发的多个方向,如全新药物设计、分子对接、虚拟筛选、成药性预测等,成为推动创新药物研究的新动力[5−6]。
本文提出了一种名为“分子工厂”的药物发现工作流程,旨在通过AI协助新药研发人员开展高效的苗头化合物设计和优化。“分子工厂”是一个全流程的分子筛选和设计解决方案,其融合了自主研发的智能分子生成模型、高效分子过滤策略、高性能分子对接算法以及高精度亲和力预测等方法,已作为核心模块被整合进一站式药物设计软件平台DrugFlow。如图2所示,用户在分析特定蛋白质靶点确定分子生成方案以及分子过滤条件后,便可利用“分子工厂”模块自动完成包括基于分子生成模型的新结构生成、基于理化性质(1D)和三维(3D)特征的分子过滤、靶标-小分子结合构象和亲和力预测在内的整个流程,最终设计出潜在的活性分子,从而提升了新药研发的效率和成功率。
1. 材 料
1.1 蛋白质结构
人源Menin蛋白和SNDX-5613形成的复合物共晶结构下载自蛋白质数据库,编号为7UJ4。该结构通过X射线衍射获得,分辨率为1.96 Å[3]。复合物中的SNDX-5613分子即为Syndax Pharmaceuticals公司开发的revumenib,该分子目前已经进入临床Ⅱ期试验。
1.2 Menin抑制剂活性数据
Menin抑制剂的结构和活性数据主要来源于ChEMBL 数据库和BindingDB数据库,此外本研究还收集了文献或专利报道的其他相关化合物,最终一共得到2493个Menin抑制剂。
2. 方 法
本文涉及的计算部分的工作均基于“分子工厂”模块完成,“分子工厂”主要包括分子生成、分子过滤、分子对接、分子活性预测等四大功能,下面对各功能进行具体的介绍。
2.1 分子生成
为了给用户提供完善和灵活的分子生成功能,本研究整合了多种基于配体和基于结构的分子生成模型,并提供了友好的图形界面。分子生成模型支持多种分子设计模式,包括R-group生成、Linker生成、骨架跃迁以及从头设计等,可满足不同的设计需求。此外,“分子工厂”允许用户上传已知活性分子的数据集,系统可自动对生成模型进行微调,以提高针对特定靶点的分子生成的特异性和精确度。目前“分子工厂”支持的分子生成模型包含ResGen、Delete、smilesGPT、CarsiLinker、CarsiLinker3D等。其中ResGen是一种基于蛋白口袋的三维分子生成模型,主要用于从头设计具有高度定制化目标的药物分子[7]。Delete是一种基于蛋白质口袋的深度结构优化模型,以蛋白质-配体相互作用为条件,通过统一的删除(遮蔽)策略完成药物分子结构优化中的片段扩展、连接和替换等任务[8]。SmilesGPT是一种基于SMILES的分子生成模型,使用PubChem中大规模的SMILES数据进行预训练,该模型结合了ADMET性质预测模型,可以通过微调生成具有特定性质的药物分子。CarsiLinker是一种专注于生成连接两个分子片段的Linker的生成模型,该模型结合了条件生成模型和E(3)等变图变分自编码器,能够有效捕捉分子的三维结构信息,生成具有特定构象的分子。CarsiLinker3D在CarsiLinker的基础上,增加了模型对蛋白口袋信息的使用,并且同时支持Linker、R-group和骨架跃迁分子生成任务。
2.2 分子过滤
为了高效地过滤由生成模型产生的大量分子,本研究建立了一套高效的自动化过滤流程,包括1D和3D过滤,可快速过滤掉成药性较差的分子。在1D筛选阶段,本研究主要关注分子的理化性质,这些性质与成药性密切相关,包括分子量、拓扑极性表面积(topological polar surface area, TPSA)、脂水分配系数(LogP)和水溶性指标(LogS)等,此外,本研究还排除了含有非特异性反应性子结构的化合物(PAINS)和具有潜在毒性或不利药理活性的警示结构(alert structures)的分子[9−10]。基于这种多指标的1D过滤方法,能够从生成的分子中快速剔除不符合要求的化合物,从而为后续的3D过滤提供更精练的候选分子。3D过滤方法主要是基于分子对接技术来评估化合物结合构象的合理性。具体而言,本研究计算了对接后的化合物选定保留部分构象的均方根偏差(RMSD),这一指标可表征化合物的特定子结构的空间构象在生成前后的一致性。此外,还可以分析蛋白质与配体之间的相互作用[11],例如考察配体能否与蛋白质的关键氨基酸残基形成特定的关键相互作用。为了评估生成分子与参考分子之间的形状相似性,可采用最大化三维重叠算法来评估它们的形状相似性[12−14]。鉴于3D形状相似性的分子更可能与靶标形成相似的几何匹配,这一评估步骤对于判别生成的分子能否与靶标形成有效的相互作用至关重要。
2.3 分子对接
分子对接能够预测小分子配体与蛋白靶标之间的结合模式及结合强度[15],已成为基于靶标结构的药物设计中不可或缺的工具,被广泛用于大型化合物库的虚拟筛选。“分子工厂”中的分子对接方法包含了基于物理原理的传统分子对接方法AutoDock Vina以及基于AI的分子对接方法KarmaDock和CarsiDock。基于AI算法的对接方法利用深度学习算法来实现构象搜索和打分,在结合构象和亲和力评估的可靠性有一定优势,此外还能大幅提高计算速度。
AutoDock Vina是一款经典的开源分子对接程序,被广泛用于药物设计和筛选[16−17]。KarmaDock是一种基于AI的端到端AI对接及打分方法,在对接速度和精度上超越了大多数传统对接/打分方法,在3090英伟达GPU卡上对接一个分子的平均耗时仅为0.017 s,可实现化合物库的超高通量虚拟筛选;该模型在Casf2016数据集上的富集因子(EF1%)为23.4,在同类方法中处于领先水平[18]。CarsiDock是一种基于深度学习的创新分子对接方法,该方法基于Transformer并参考了AlphaFold2的模型架构,采用了千万条传统分子对接方法预测得到的蛋白-配体复合物结构数据进行预训练,然后再用2万条复合物晶体结构数据进行微调,使得其在PDBbind Core set数据集上的对接成功率(RMSD<2Å)达到了92.28%;此外,该方法通过构象合理化模块能够保证配体分子的原子坐标预测精度达到当前最佳[19]。
2.4 分子活性预测
分子活性预测模块中还集成了基于连续介质模型的结合自由能预测方法MM/PBSA方法以及基于AI的蛋白-配体打分函数RTMScore,利用这两种方法可对筛选后的分子提供更高精度的活性评估。MM/PBSA方法是一种基于连续介质模型的终点式结合自由能预测方法,通过分子力学和求解泊松-玻尔兹曼方程来预测配体-蛋白间的结合自由能。RTMScore是一种基于AI的蛋白质-配体结合强度预测的新型打分函数,通过Graph Transformer提取蛋白质的氨基酸残基以及配体的原子节点特征,并通过混合密度网络(mixture density network, MDN)获取蛋白质各氨基酸残基和配体各原子间距离的概率密度分布,最后将其转化为统计势以用于蛋白-配体间结合强度的评估[20]。RTMScore的筛选能力在CASF-2016标准数据集上显著超越了当前的其他主流方法,其在有无天然构象的存在下分别可取得97.3%和93.4%的平均top1对接成功率(DeepDock和PIGNet在无天然构象时仅为87.0%);而在筛选能力评估中可取得66.7%的平均top1成功率和28.00的1%富集因子(DeepDock和PIGNet的两项指标分别为55.4%、19.60以及43.9%、16.41)。同时本研究进一步在DEKOIS2.0数据集上评估了RTMScore筛选能力,结果表明RTMScore的富集能力明显优于以相似策略构建所得的DeepDock和经典方法Glide SP。
2.5 体外活性评价
本研究首先对阳性参照药物(SNDX-5613)进行了稀释,以制备一系列浓度梯度的溶液,其中稀释液作为起始点,按照3倍稀释度进行连续稀释,共设置10个稀释点及一个未添加药物的对照点。随后,将50/100 nL的化合物分别转移至384孔板中,每个孔设置两个重复样本。转移完毕后,对384孔板进行1000 r/min的离心处理。接下来,分别向每个孔中加入Menin-WT、Menin-M327I和Menin-T349M蛋白5 μL,并在25 ℃下孵育10 min。之后向每个孔中加入FITC-MLL4-43荧光标记底物5 μL,再次进行1000 r/min的离心,并在25℃下继续孵育60 min。最终,利用BMG荧光酶标仪读取荧光信号强度。数据分析部分,采用非线性回归模型来拟合化合物的IC50。
3. 结果与讨论
3.1 数据集的收集与准备
本研究首先分析了Menin晶体结构(PDB ID:7JU4)中蛋白质与配体SNDX-5613间的相互作用。如图3所示,在晶体结构中配体与TYR-276、MET-322及TRP-341形成氢键,将其作为后续分子3D过滤的参考条件。
从文献和数据库中收集Menin抑制剂的结构和实验活性数据,并剔除重复数据和数据集中未定量标记活性的化合物。为了减轻实验数据差异导致的影响,本研究根据IC50定义了3种不同的活性类别,分别为“active”(高活性)、“inactive”(低活性)和“inconclusive”(活性不确定)。其中IC50小于100 nmol/L的数据标记为“active”,IC50大于1000 nmol/L的数据标记为“inactive”,IC50介于100~1000 nmol/L之间的数据标记为“inconclusive”。最终得到了1600条数据,其中“active”数据为1002条,其分子量、TPSA、LogP及LogS的分布见图4。由图可见,对于IC50小于100 nmol/L的分子,其分子量主要分布在500~800 之间,TPSA主要分布在70~140之间,LogP主要分布在3~6之间,LogS主要分布在–8~–5之间。本研究将活性分子的性质分布作为后续分子1D筛选的参考条件。
3.2 分子生成结果
目前Menin主要发生两种耐药突变:M327I和T349M,这两个氨基酸位于与SNDX-5613磺酰胺部分附近的空间位置。这一发现提示,针对这部分的优化可能会显著提高与Menin的结合选择性,进而克服这些耐药突变。因此,在分子生成环节中,本研究采用了R-group生成策略,把结构改造的重点集中在SNDX-5613中的环己烷与磺酰胺部分。
本研究利用“分子工厂”模块进行了一系列基于Menin蛋白结构的分子生成计算。首先利用收集到的Menin活性分子数据集对分子生成模型进行强化学习,通过这一步骤,模型能够更好地理解Menin抑制剂的结构特征。随后,定义活性分子SNDX-5613中需要保留的部分,通过R-group生成策略生成了共计53万个衍生物。生成分子的分子量、TPSA、LogP、LogS的分布如图5所示。从分布结果来看,绝大多数生成的分子均符合1D筛选的标准范围,这表明本研究的分子库具有较好的成药性特征。这些生成的分子随后采用“分子工厂”中分子过滤功能进行系统评估,以筛选出最具潜力的候选分子。
3.3 基于1D和3D的分子过滤
对于生成的分子,本研究采用了1D和3D两种策略进行了过滤。1D过滤的参数包括分子量、TPSA、LogP、LogS、PAINS规则以及Alert Structures等。共有126223个候选分子通过了1D参数过滤,这些分子的化学空间分布如图6所示。通过对比分析,发现AI模型生成的分子在化学空间中的覆盖范围更为广泛,表明这些分子具有较高的化学多样性。此外,本研究还观察到Menin活性化合物的化学空间被AI模型生成的分子所包含,这表明AI模型生成的分子与已知的Menin活性化合物在化学性质上具有相似性。这一发现不仅证实了AI模型生成分子的化学多样性,也暗示了这些分子中可能存在具有潜在的活性化合物。
本研究进一步使用“分子工厂”中的CarsiDock方法预测了所有候选分子与Menin间的相互作用模型。在基于蛋白-配体相互作用的3D分子过滤中,重点关注蛋白质中的几个关键氨基酸残基(TYR-276、MET-322以及TRP-341)能否与化合物形成较为稳定的氢键。此外,本研究还评估了对接后的分子构象与参考分子中保留原子的均方根偏差(RMSD)。最终,确定了114个具有高潜力的候选分子,这些分子不仅保留了与目标蛋白质的关键相互作用,同时与参考分子具有较高的3D形状相似性。
3.4 候选分子的生物活性评价
在完成分子对接分析后,采用了RTMScore方法预测了分子的亲和力;此外,还分析了上一步3D过滤中得到的蛋白-配体相互作用。通过这一综合评估过程,本研究最终筛选出了11个候选分子,这些分子在结构上与参考分子存在较为显著的差异,显示出较高的新颖性和多样性。随后,对这11个分子进行了基于MM/GBSA的结合自由能预测,以准确评估它们与目标受体间的结合亲和力。计算不仅针对野生型,也包括突变型分子,以便更全面地评估其潜在活性。在对计算结果进行深入分析,并结合专家的专业意见及合成可行性分析后,最终确定了5个分子(RG-06、RG-07、RG-10、D5-18-9、D5-18-11)作为候选化合物,进行后续的生物活性实验评价。本研究评估了这5个候选化合物对Menin蛋白野生型(Menin-WT)及其两种突变型(Menin-M327I和Menin-T349M)的抑制活性,并将这些结果与参考分子SNDX-5613进行比较。IC50被用来量化表征化合物的活性,单位为纳摩尔(nmol/L),其中较低的IC50表示更强的抑制效果,实验结果如表1所示。对于Menin-WT,相较于阳性参考分子SNDX-5613的IC50(11.86 nmol/L),化合物RG-06和RG-10的IC50可分别达到32.91和9.681 nmol/L,表明它们对野生型具有和SNDX-5613相同数量级的抑制活性。特别是RG-10,其活性甚至优于参考分子。对于Menin-M327I突变体而言,参考分子SNDX-5613的IC50增加至1421 nmol/L,表明对该突变体的抑制活性显著下降。相比之下,RG-06和RG-10的IC50分别为513.8和233.2 nmol/L,虽然抑制活性有所降低,但仍具有一定的抑制效果。而化合物D5-18-11和D5-18-9的IC50较高,表明这两个化合物对M327I突变体的抑制活性较弱。对于Menin-T349M突变体而言,参考分子SNDX-5613的IC50为280.2 nmol/L,相比野生型活性也有所降低,但幅度没有M327I大。值得注意的是,RG-06和RG-10在这一突变型中仍表现出显著的抑制活性,IC50分别为53.8和40.09 nmol/L,显著低于SNDX-5613,表明这两个化合物对Menin-T349M突变体具有明显的优势。
Table 1. Biological activities of five candidates against Menin-WT, Menin-M327I and Menin-T349MTarget Compound ID IC50/(nmol/L) Menin-WT SNDX-5613 11.86 RG-06 32.91 RG-10 9.681 D5-18-11 382.7 D5-18-9 221.7 RG-07 364.3 Menin-M327I SNDX-5613 1421 RG-06 513.8 RG-10 233.2 D5-18-11 625.3 D5-18-9 363.2 RG-07 590.7 Menin-T349M SNDX-5613 280.2 RG-06 53.8 RG-10 40.09 D5-18-11 1611 D5-18-9 326 RG-07 384.9 RG-06和RG-10对Menin-T349M突变体显著抑制活性,意味着它们在结构上能够更好地适应突变体,这为Menin抗耐药抑制剂的设计提供了有价值线索。在未来的工作将集中在进一步优化这些化合物的结构,以增强它们对不同Menin突变体的抑制活性,并在细胞和动物模型中评估它们的药效和安全性。
4. 结论与展望
借助DrugFlow中“分子工厂”模块的智能化工作流程,综合运用分子生成、性质过滤、对接以及亲和力预测等功能,本研究从数十万个分子中最终筛选出5个Menin的潜在抑制剂,并进一步测试了它们对Menin蛋白野生型和突变体的抑制活性。结果表明,化合物RG-06和RG-10对Menin蛋白具有良好的抑制活性,尤其是RG-10对Menin-WT表现出和阳性参考分子SNDX-5613相近的活性,且对Menin-M327I和Menin-T349M两个突变体在抑制活性上优于参考分子近7倍。这样不但为Menin第2代抑制剂对开发提供了有价值的参考,同时验证了“分子工厂”在实际药物筛选和设计工作的效果。
展望未来,本研究将进一步优化“分子工厂”流程,特别是在分子生成和亲和力预测方面,将继续探索和开发更先进的算法。此外,考虑在“分子工厂”中整合数据准备方面的功能,通过利用大语言模型的先进文本分析能力,高效地从科学文献和数据库中自动提取关键的靶点信息和化合物信息,从而帮助用户提高信息收集和分析的效率。相信随着人工智能技术的不断进步和应用,“分子工厂”将成为药物研发领域的重要工具。
-
Table 1 Biological activities of five candidates against Menin-WT, Menin-M327I and Menin-T349M
Target Compound ID IC50/(nmol/L) Menin-WT SNDX-5613 11.86 RG-06 32.91 RG-10 9.681 D5-18-11 382.7 D5-18-9 221.7 RG-07 364.3 Menin-M327I SNDX-5613 1421 RG-06 513.8 RG-10 233.2 D5-18-11 625.3 D5-18-9 363.2 RG-07 590.7 Menin-T349M SNDX-5613 280.2 RG-06 53.8 RG-10 40.09 D5-18-11 1611 D5-18-9 326 RG-07 384.9 -
[1] Yokoyama A, Cleary ML. Menin critically links MLL proteins with LEDGF on cancer-associated target genes[J]. Cancer Cell, 2008, 14(1): 36-46. doi: 10.1016/j.ccr.2008.05.003
[2] Issa GC, Aldoss I, DiPersio J, et al. The menin inhibitor revumenib in KMT2A-rearranged or NPM1-mutant leukaemia[J]. Nature, 2023, 615(7954): 920-924. doi: 10.1038/s41586-023-05812-3
[3] Perner F, Stein EM, Wenge DV, et al. MEN1 mutations mediate clinical resistance to menin inhibition[J]. Nature, 2023, 615(7954): 913-919. doi: 10.1038/s41586-023-05755-9
[4] Grisham J. Menin Inhibitors: Promising New Drug Treatment for Aggressive Leukemia | Memorial Sloan Kettering Cancer Center[EB/OL]. (2023-03-15)[2024-03-22]. https://www.mskcc.org/news/promising-new-type-drug-aggressive-leukemia.
[5] Cavasotto CN, di Filippo JI. Artificial intelligence in the early stages of drug discovery[J]. Arch Biochem Biophys, 2021, 698: 108730. doi: 10.1016/j.abb.2020.108730
[6] Gupta R, Srivastava D, Sahu M, et al. Artificial intelligence to deep learning: machine intelligence approach for drug discovery[J]. Mol Divers, 2021, 25(3): 1315-1360. doi: 10.1007/s11030-021-10217-3
[7] Zhang O, Zhang JT, Jin JY, et al. ResGen is a pocket-aware 3D molecular generation model based on parallel multiscale modelling[J]. Nat Mach Intell, 2023, 5: 1020-1030. doi: 10.1038/s42256-023-00712-7
[8] Zhang HT, Zhao HF, Zhang XJ, et al. Delete: deep lead optimization enveloped in protein pocket through unified deleting strategies and a structure-aware network[EB/OL]. arXiv, 2023: 2308.02172. http://arxiv.org/abs/2308.02172.
[9] Xiong GL, Wu ZX, Yi JC, et al. ADMETlab 2.0: an integrated online platform for accurate and comprehensive predictions of ADMET properties[J]. Nucleic Acids Res, 2021, 49(W1): W5-W14. doi: 10.1093/nar/gkab255
[10] Jiang DJ, Lei TL, Wang Z, et al. ADMET evaluation in drug discovery. 20. Prediction of breast cancer resistance protein inhibition through machine learning[J]. J Cheminform, 2020, 12(1): 16. doi: 10.1186/s13321-020-00421-y
[11] Adasme MF, Linnemann KL, Bolz SN, et al. PLIP 2021: expanding the scope of the protein-ligand interaction profiler to DNA and RNA[J]. Nucleic Acids Res, 2021, 49(W1): W530-W534. doi: 10.1093/nar/gkab294
[12] Hain E, Camacho CJ, Koes DR. Fragment oriented molecular shapes[J]. J Mol Graph Model, 2016, 66: 143-154. doi: 10.1016/j.jmgm.2016.03.017
[13] Nicholls A, McGaughey GB, Sheridan RP, et al. Molecular shape and medicinal chemistry: a perspective[J]. J Med Chem, 2010, 53(10): 3862-3886. doi: 10.1021/jm900818s
[14] Koes DR, Camacho CJ. Shape-based virtual screening with volumetric aligned molecular shapes[J]. J Comput Chem, 2014, 35(25): 1824-1834. doi: 10.1002/jcc.23690
[15] Muhammed MT, Aki-Yalcin E. Molecular docking: principles, advances, and its applications in drug discovery[J]. Lett Drug Design Discov, 2024, 21(3): 480-495.
[16] Trott O, Olson AJ. AutoDock Vina: improving the speed and accuracy of docking with a new scoring function, efficient optimization, and multithreading[J]. J Comput Chem, 2010, 31(2): 455-461. doi: 10.1002/jcc.21334
[17] Eberhardt J, Santos-Martins D, Tillack AF, et al. AutoDock vina 1.2. 0: new docking methods, expanded force field, and python bindings[J]. J Chem Inf Model, 2021, 61(8): 3891-3898. doi: 10.1021/acs.jcim.1c00203
[18] Zhang XJ, Zhang O, Shen C, et al. Efficient and accurate large library ligand docking with KarmaDock[J]. Nat Comput Sci, 2023, 3(9): 789-804. doi: 10.1038/s43588-023-00511-5
[19] Cai H, Shen C, Jian TY, et al. CarsiDock: a deep learning paradigm for accurate protein-ligand docking and screening based on large-scale pre-training[J]. Chem Sci, 2024, 15(4): 1449-1471. doi: 10.1039/D3SC05552C
[20] Shen C, Zhang XJ, Deng YF, et al. Boosting protein-ligand binding pose prediction and virtual screening based on residue-atom distance likelihood potential and graph transformer[J]. J Med Chem, 2022, 65(15): 10691-10706. doi: 10.1021/acs.jmedchem.2c00991