Enamine 的 REAL Space 代表了世界上最大的、不断扩展的按需制造虚拟化合物库,它建立在数百万并行合成的经验见解之上。虽然巨大的化学空间提供了令人难以置信的潜力,但从数十亿个虚拟分子中选择最有希望成功开发药物的化合物仍然是一项艰巨的任务。这就是人工智能和机器学习发挥作用的地方,它能够创建更小、高度聚焦的库,这些库的性能始终优于传统的大型HTS集合。通过将 Recursion 公司的尖端 AI/ML 工具之一 MatchMaker 与 REAL Space 集成,我们从 15 000 种新合成的化合物中,设计了 10 个强大的筛选库,专门用于精确和快速地加速药物发现。

Recursion(纳斯达克股票代码:RXRX)是一家领先的临床阶段科技生物公司,它运用先进的机器学习技术,结合世界上最大的专有生物和化学数据集之一,对生物学进行解码,从而实现了药物发现的精确性和高效性。Recursion 的工具 MatchMaker 运用机器学习技术预测小分子与多个蛋白质靶标的兼容性,为传统方法提供了一种可扩展性强且计算量较小的替代方案。这有助于加快决策速度,丰富 Recursion 的数据集,并通过精确建模前的筛选,加速药物研发进程。

这个化学化合物库究竟有何独特之处,又有何价值?

大多数商业化合物库涵盖了诸如 G 蛋白偶联受体(GPCR)、激酶或抗菌剂在内的广泛生物学领域,其中可能包含数百乃至数千种不同的蛋白质。在此,我们提供了靶向库,这些库是从 Enamine REAL Space 中筛选出的子集,它们依据蛋白质结合特性分组时发现的共同特征而设计。这些基于人工智能的库是围绕 100 个最具潜力和临床相关性的药物靶点构建的,这些靶点被归入 10 个不同的家族中。

开发的策略

作为第一步,我们利用 MatchMaker(一种基于海量生化数据集训练的神经网络模型)将人类蛋白质组编码为结合可能性向量,以预测蛋白质-配体相互作用对,即药物靶点相互作用(DTI)。然后,我们对整个 Enamine REAL Space 文库进行了扫描,以寻找蛋白质组内的推定相互作用,并将得到的 2.8 千万亿次成对相互作用(化合物与蛋白质)的矩阵在合成子水平上进行汇总。它可以被导航以识别化学蛋白质组簇:预测会与结构和化学上相似的化合物结合的小而集中的靶标集。


左)MatchMaker 配体-靶相互作用可能性得分被映射到由化学理论构建块合成子定义的降维空间上。右)人类蛋白质组的 2D 投影,作为合成子空间中 MatchMaker DTI 预测谱的函数。当相似的蛋白质家族聚集在一起时,特征空间承载着固有的生物和功能信息。

  • 靶向文库是从与感兴趣的生物途径相关的种子靶标列表开始设计的,并扩展到相关的化学蛋白质组簇。
  • 根据 MatchMaker DTI 预测得分,将化合物与每个簇中的目标进行排序。
  • 选择最终的化合物库集合是通过应用一系列经典药物化学方法、DMSO 稳定性和可合成性过滤器,最大限度地提高类药物、可合成化学空间的多样性。
  • 合成了 15 000 种新化合物,以提供高度聚焦的人工智能驱动化合物库

详情请点击此处