AI 赋能的文库
利用生成式 AI 和预测模型设计,旨在实现最高效的苗头化合物发现
Enamine 的 REAL Space 代表了全球最大、持续扩展的“按需合成”型虚拟化合物库,其构建基于数百万次平行合成实验所获得的深刻洞察。尽管广阔的化学空间蕴藏着难以估量的潜力,但从数以十亿计的虚拟分子中筛选出最适合药物开发的优质化合物,仍是一项艰巨的挑战。这正是人工智能(AI)与机器学习(ML)发挥作用的地方——它们能够助力创建规模更小但高度聚焦的化合物库,且在筛选表现上持续优于传统的大型高通量筛选(HTS)集合。通过将 Recursion 公司的前沿 AI/ML 工具 MatchMaker 与 REAL Space 相结合,我们从 15,000 种新合成的化合物中精心筛选并整理出了 10 个功能强大的筛选化合物库。这些化合物库专为实现精准、快速的药物发现而设计,旨在显著加速研发进程。
Recursion(纳斯达克股票代码:RXRX)是一家处于临床阶段的领先 TechBio(技术生物学)公司。该公司利用先进的机器学习技术,依托全球最大的专有生物与化学数据集之一,解码生物学机制,从而在药物发现中实现精准性与高效率。Recursion 开发的工具 MatchMaker,利用机器学习来预测小分子与多个蛋白靶点的结合兼容性。它提供了一种可扩展、计算资源消耗更低的替代方案,区别于传统的筛选方法。该技术能够实现更快的决策制定,增强 Recursion 的数据集,并通过预筛选为精准建模提供支持,从而加速药物发现进程。
是什么让这个化合物库与众不同且极具价值?
大多数商业化的化合物库覆盖了生物学的广泛领域,例如 GPCR、激酶或抗菌类,这些领域可能包含数百至数千种不同的蛋白质。而我们提供的则是靶向化合物库,它们是从 Enamine REAL Space 中筛选出的特定子集,其设计依据是将蛋白质按其结合特性进行分组后所发现的共同特征。这些由 AI 赋能的化合物库,围绕着最具前景且具有临床相关性的百余种药物靶点构建,并将这些靶点归纳为 10 个家族。
开发策略
首先,利用 MatchMaker(一种在海量生化数据集上训练的神经网络模型),将人类蛋白质组编码为结合可能性向量,以预测蛋白-配体相互作用对(即通常所说的药物-靶点相互作用,DTI)。随后,该模型对整个 Enamine REAL Space 化合物库在蛋白质组范围内进行了推定相互作用扫描。生成的包含 280 万亿次相互作用的成对矩阵(化合物 vs 蛋白质),在合成子(synthon)层面进行了聚合分析。由此产生的化学空间蕴含了丰富的化学与生物学信息。通过对其进行探索,可以识别出化学蛋白质组学聚类:即预测能与结构和化学性质相似的化合物结合的小型、聚焦性靶点集合。

左)MatchMaker 预测的配体-靶点相互作用可能性评分,被映射到了由合成子(化学的理论构建单元)定义的低维空间中。右)人类蛋白质组在合成子空间中,依据其 MatchMaker 药物-靶点相互作用(DTI)预测特征进行的二维投影。
- 聚类扩展:靶向化合物库的设计始于一份与特定生物学通路相关的“种子靶点”列表,并将其扩展至相关的化学蛋白质组学聚类。
- AI 排序:根据化合物与各聚类中靶点的 MatchMaker DTI 预测评分,对化合物进行排序筛选。
- 多样性优化与过滤:在最终选定化合物库时,通过应用一系列经典的药物化学规则、DMSO 稳定性及可合成性过滤器,旨在药物样性、可合成的化学空间中最大化化合物的多样性。
- 合成交付:最终合成了 15,000 种新化合物,以交付这些高度聚焦且由 AI 驱动的化合物库。
化合物库目录
| 产品名 | 数量 | 摘要 | 文件下载 |
|---|---|---|---|
| 靶向 CRLs 家族库文库 |
1 600 化合物 |
专注于靶向最有开发前景的 CRLs 家族 |
|
| 靶向 HECT E3 连接酶文库 |
1 520 化合物 |
旨在靶向 3 种 HECT E3 连接酶,以发现新一代药物 |
|
| 靶向 RBR E3 连接酶文库 |
1 520 化合物 |
专为发现 RNF216、RNF19A、PRKN、RNF13 强效结合剂和调节剂而设计 |
|
| AI 赋能的 USP 文库 |
1 200 化合物 |
旨在调节最大的 DUBs 家族,并为不治之症提供有前景的治疗方法 |
|
| AI 赋能的 GPCR 文库 |
1 760 化合物 |
旨在提供 CCR5、HTR2A、HTR2B、MRGPRX1、CXCR6、CMKLR2、CCR10、GPR3、GPR4、GPR39、CCR4 受体的新型高效调节剂 |
|
| HIPPO 信号通路文库 |
1 600 化合物 |
旨在为 Hippo 信号通路中涉及的 10 多个基本靶点提供可靠的苗头化合物 |
|
| AI 赋能的分子伴侣文库 |
1 360 化合物 |
专为寻找 Hsp90、Hsp70、Hsp60、HspD1、ClpP、Ch60 和 Hsp100 蛋白靶标而设计 |
|
| AI 赋能的别构离子通道文库 |
2 080 化合物 |
调控最有研究价值、最有效且临床记录良好的药物靶点的新方法 |
|
| AI 赋能的 PARP 文库 |
1 440 化合物 |
旨在靶向研究最多、最有效的药物发现 PARPs 靶点 |
|
| AI 赋能的 TF 文库 |
1 520 化合物 |
最热门的蛋白质靶点,用于发现最具挑战性和尚未治疗的疾病的新疗法 |
|
技术支持
我们提供全面的支持来开发您的苗头化合物。当然,当生物活性物质来源于我们的筛选库时,这类项目能够最有效地实现。然而,即使苗头化合物来自其他供应商的库,我们也能够在手中最有效地推进先导化合物的识别和优化项目。有时候,我们只需要合成所给化学系列的第一个实例并验证合成路线即可。
