【新闻事件】:昨天两年一度的预测蛋白结构CASP大赛揭晓,结果谷歌旗下Deepmind的AlphaFold2以较大优势冠军。这个AI从氨基酸序列准确预测了约100个蛋白的三维结构,平均GDT(大概测量与实验结构的平均偏差)分值92.4、几乎达到实验水平。这个结果引起各界一片惊叹,《自然》杂志说这将改变一切、有人甚至声称蛋白折叠问题已经不再是问题。这一方面是大家对AI工夫如此了得的惊讶、另一方面似乎也期待新药发现将变得容易很多。
【药源解析】:这个结果无疑是个巨大成就。蛋白本是一个长链氨基酸聚合物,可能构象数目巨大。据估计一个普通蛋白的构象数目在10的300次方,而且很多构象能量非常接近、所以预测天然结构如大海捞针。很多天然蛋白可在极短时间内折叠成极少数具有高选择性、高活性的三维结构,如同一根铁丝眨眼间自己折成一个大熊猫。获得三维结构可以通过实验如X光、冷电镜、核磁等实验手段,也可以同源蛋白做模板预测。这个AlphaFold利用机器学习技术摆脱了上面这些技术限制,而且准确度惊人。这显然对新药发现可能有一定帮助。
但是这并一定能转化成新药产出的大幅增加。一是对于复杂蛋白复合物现在AI还预测能力有限,而这些蛋白-蛋白、核酸-蛋白复合物如表观遗传蛋白、DNA解旋酶等正在成为制药业关注的新兴靶点家族。二是虽然蛋白结构很重要但蛋白因为上面提到存在多个能量类似构象也很容易变形,尤其是与小分子配体结合后,所谓诱导契合是个很老的现象。所以如果没有与先导物的共晶结构药物设计还是会受到限制。很多做CADD的朋友认为docking等计算技术可以根据蛋白结构预测小分子配体结合强度,我不否认有成功案例、但当代最重要的有机化学家George Whitesides最近还说总体上docking仍是一个悬而未决的技术难题。三是蛋白结构只能提供更可靠思路,但把设计变成化合物还受合成技术的限制、也与结合腔的内在结构有关。分子间相互作用是有极限的(0.3 kcal/mol/重原子),如果没有足够的接触面积是无法达到药物水平的结合力的。
找到高活性小分子配体也只是新药发现的一小部分,选择性、过膜性、稳定性等成药性质也需要优化。虽然活性配体越多选择也越多,但如何评价这些性质并不是精准科学。除了化学问题还有更难的生物问题,这个靶点是否在治疗疾病有用几乎是无法在三期临床前可靠预测的,这也是为什么临床试验失败率多年高居不下的原因。蛋白结构在很多药靶并非限制因素,一些有实验晶体结构的靶点如Kras还是找不到高效配体。当然能加快可成药靶点配体的发现速度也是一个重要贡献,但说能改变一切有点过于乐观。当年RBW合成奎宁后也令很多人乐观地预测人类将不再依赖自然界获取药物,但现在合成技术与RBW时代不可同日而语但还是不能产业化全合成紫杉醇。AI如此高效也引起有些人担心会取代科学家的工作,当然有些工作会被AI代替、但AI进步的净结果基本是会扩展人类技术的可及范围,而不仅仅是把科学家踢出现在的小圈子。
美中药源原创文章,转载注明出处并添加超链接,商业用途需经书面授权。★ 请关注《美中药源》微信公众号 ★