【新闻事件】:最近诺华的科学家在《Nat. Chem. Bio》发表一篇有趣的文章分析化合物库中很少对任何靶点有活性的化合物。在诺华至少被筛过100次的80万化合物中有14%(11万)化合物未能在任何筛选显示活性。同样在Pubmed发表的429个筛选中有36%的化合物没有对任何靶点显示活性。这些化合物被命名为化学暗物质(dark chemical matter,DCM)。这些化合物是滥竽充数的南郭先生还是少林扫地僧式的武林高手?
【药源解析】:现在绝大多数新药研发项目开始于随机筛选,所以化合物库的质量直接影响项目的开始速度甚至生存。因为每个项目涉及的蛋白靶点千差万别,所以化合物库的多样性非常重要。这好比为了准备尚未出现的奥运项目,你不知道将要出现的项目是需要力量、速度、还是智力型选手,所以最好什么样的人才都储备一些。
由于历史原因各大公司的化合物库鱼目混杂。最好的一类化合物是所谓优势骨架(privileged scaffold)衍生物。这类分子可以和多于一个蛋白结合,但选择性可以优化,相当于力量好、速度快的选手,可以在多个项目拿金牌。有一类常见的化合物经常和各种靶点非特异结合,选择性和活性都很难优化,相当于体委子弟。什么项目招人都能挤进去,但哪个项目也出不了成绩。这类化合物早已引起业界注意,并有多种计算和实验手段排除这类化合物。
但什么都不结合的化合物却一直没人留意,一个重要原因是大家对阴性结果一向重视不够,所以今天这个分析很有意义。作者排除了一些明显的因素,比如过膜性。如果化合物极性太大显然无法在细胞筛选中显示活性,但这类DCM的过膜性与其它化合物没有显著区别。另一个原因可能是这些化合物不稳定,已经分解成无用物质。但比较纯度之后发现DCM的纯度与其它化合物无异。这些DCM也不是集中在某些特定化学空间,而是到处都是。这些化合物结构稍有变化即可成为活性化合物,甚至会成为frequent hitters(即对多个蛋白有活性)。
DCM的共同特征是水溶性好、脂溶性差、分子较小。这些都可以理解。水溶性好的分子自然愿意留在水里而不是到蛋白中。多数蛋白的结合腔是疏水的,所以疏水性差的分子结合能力差不奇怪。小分子的结合位点少,也可以解释结合力低。但是这些因素还不能完全解释DCM因为并非所有脂溶性差的小分子都是DCM。这些分子像是正常分子经某些特定改造被赶出了活性空间,作者已经找到一些改造规律。
这些分子分布在化学空间的各个角落,并和很多活性空间接壤,所以这些化合物可能是优质先导物因为它们选择性更好。另外现在先导物优化的过程基本就是增加分子量、脂溶性的过程,但这两个指标都有上限。超过一定程度药代、毒性都成问题,所以分子量小、脂溶性差是个优势。所以这些DCM不应被看作滥竽充数的南郭先生,而是不鸣则已、一鸣惊人的少林扫地僧。
美中药源原创文章,转载注明出处并添加超链接,商业用途需经书面授权。★ 请关注《美中药源》微信公众号 ★