Enamine REAL 数据库
目前最大的、可合成的类药分子枚举数据库
REAL 数据库是探索 Enamine REAL 化合物的中类药分子的一种方式。该数据库是 Enamine REAL 化合物空间的一个子集,可作为工具用于通过大规模虚拟筛选寻找新的苗头化合物(hit),以及搜索已有苗头化合物的类似物。REAL 数据库以 SMILES 和 SDF 格式提供,并且可以在 store.enamine-genez 网站上进行搜索。
当前版本的 REAL 数据库包含超过 101 亿个分子,这些分子符合 Lipinski 的类药五原则(Ro5) 和 Veber 判据:分子量 (MW) ≤ 500、脂溶性 (SlogP) ≤ 5、氢键受体数 (HBA) ≤ 10、氢键供体数 (HBD) ≤ 5、可旋转键数 (RotBonds) ≤ 10 和极性表面积 (TPSA) ≤ 140。
尽管 REAL 数据库规模庞大,但它易于使用。除了提供每个 REAL 分子的 SMILES 结构 和 目录编号(catalog ID) 外,您还可以获取一系列重要的理化参数(如分子量 MW、脂溶性 SLogP、氢键受体数 HBA、氢键供体数 HBD 等),以及该分子在 REAL 数据库中的子集归属、所采用的化学类型,从而反映出其合成所需的工作量等级(“s”,simple chemistry,标准化学方法,合成难度低、工作量小;“m”,advanced chemistry,先进化学方法,合成难度较高、工作量大),如需获取用于合成这些 REAL 化合物的分子砌块(building blocks)列表,也可应请求提供。
下载 Enamine REAL 数据库(101 亿个化合物)
分子根据重原子数 (HAC) 进行排序的。字段说明可此处找到。