生物活性化合物库

利用生成式 AI 和预测模型设计,旨在实现最高效的苗头化合物发现

Enamine 的 REAL Space 代表了全球最大、持续扩展的“按需合成”型虚拟化合物库,其构建基于数百万次平行合成实验所获得的深刻洞察。尽管广阔的化学空间蕴藏着难以估量的潜力,但从数以十亿计的虚拟分子中筛选出最适合药物开发的优质化合物,仍是一项艰巨的挑战。这正是人工智能(AI)与机器学习(ML)发挥作用的地方——它们能够助力创建规模更小但高度聚焦的化合物库,且在筛选表现上持续优于传统的大型高通量筛选(HTS)集合。通过将 Recursion 公司的前沿 AI/ML 工具 MatchMaker 与 REAL Space 相结合,我们从 15,000 种新合成的化合物中精心筛选并整理出了 10 个功能强大的筛选化合物库。这些化合物库专为实现精准、快速的药物发现而设计,旨在显著加速研发进程。

Recursion(纳斯达克股票代码:RXRX)是一家处于临床阶段的领先 TechBio(技术生物学)公司。该公司利用先进的机器学习技术,依托全球最大的专有生物与化学数据集之一,解码生物学机制,从而在药物发现中实现精准性与高效率。Recursion 开发的工具 MatchMaker,利用机器学习来预测小分子与多个蛋白靶点的结合兼容性。它提供了一种可扩展、计算资源消耗更低的替代方案,区别于传统的筛选方法。该技术能够实现更快的决策制定,增强 Recursion 的数据集,并通过预筛选为精准建模提供支持,从而加速药物发现进程。

是什么让这个化合物库与众不同且极具价值?

大多数商业化的化合物库覆盖了生物学的广泛领域,例如 GPCR、激酶或抗菌类,这些领域可能包含数百至数千种不同的蛋白质。而我们提供的则是靶向化合物库,它们是从 Enamine REAL Space 中筛选出的特定子集,其设计依据是将蛋白质按其结合特性进行分组后所发现的共同特征。这些由 AI 赋能的化合物库,围绕着最具前景且具有临床相关性的百余种药物靶点构建,并将这些靶点归纳为 10 个家族。

开发策略

首先,利用 MatchMaker(一种在海量生化数据集上训练的神经网络模型),将人类蛋白质组编码为结合可能性向量,以预测蛋白-配体相互作用对(即通常所说的药物-靶点相互作用,DTI)。随后,该模型对整个 Enamine REAL Space 化合物库在蛋白质组范围内进行了推定相互作用扫描。生成的包含 280 万亿次相互作用的成对矩阵(化合物 vs 蛋白质),在合成子(synthon)层面进行了聚合分析。由此产生的化学空间蕴含了丰富的化学与生物学信息。通过对其进行探索,可以识别出化学蛋白质组学聚类:即预测能与结构和化学性质相似的化合物结合的小型、聚焦性靶点集合。


左)MatchMaker 预测的配体-靶点相互作用可能性评分,被映射到了由合成子(化学的理论构建单元)定义的低维空间中。右)人类蛋白质组在合成子空间中,依据其 MatchMaker 药物-靶点相互作用(DTI)预测特征进行的二维投影。

  • 聚类扩展:靶向化合物库的设计始于一份与特定生物学通路相关的“种子靶点”列表,并将其扩展至相关的化学蛋白质组学聚类。
  • AI 排序:根据化合物与各聚类中靶点的 MatchMaker DTI 预测评分,对化合物进行排序筛选。
  • 多样性优化与过滤:在最终选定化合物库时,通过应用一系列经典的药物化学规则、DMSO 稳定性及可合成性过滤器,旨在药物样性、可合成的化学空间中最大化化合物的多样性。
  • 合成交付:最终合成了 15,000 种新化合物,以交付这些高度聚焦且由 AI 驱动的化合物库。
产品名 数量 摘要 文件下载
靶向 CRLs 家族库文库

1 600

化合物

专注于靶向最有开发前景的 CRLs 家族

靶向 HECT E3 连接酶文库

1 520

化合物

旨在靶向 3 种 HECT E3 连接酶,以发现新一代药物

靶向 RBR E3 连接酶文库

1 520

化合物

专为发现 RNF216、RNF19A、PRKN、RNF13 强效结合剂和调节剂而设计

AI 赋能的 USP 文库

1 200

化合物

旨在调节最大的 DUBs 家族,并为不治之症提供有前景的治疗方法

AI 赋能的 GPCR 文库

1 760

化合物

旨在提供 CCR5、HTR2A、HTR2B、MRGPRX1、CXCR6、CMKLR2、CCR10、GPR3、GPR4、GPR39、CCR4 受体的新型高效调节剂

HIPPO 信号通路文库

1 600

化合物

旨在为 Hippo 信号通路中涉及的 10 多个基本靶点提供可靠的苗头化合物

AI 赋能的分子伴侣文库

1 360

化合物

专为寻找 Hsp90、Hsp70、Hsp60、HspD1、ClpP、Ch60 和 Hsp100 蛋白靶标而设计

AI 赋能的别构离子通道文库

2 080

化合物

调控最有研究价值、最有效且临床记录良好的药物靶点的新方法

AI 赋能的 PARP 文库

1 440

化合物

旨在靶向研究最多、最有效的药物发现 PARPs 靶点

AI 赋能的 TF 文库

1 520

化合物

最热门的蛋白质靶点,用于发现最具挑战性和尚未治疗的疾病的新疗法

技术支持