新药发现是个极低概率事件,所以业界寻找提高成功率的努力一直就没有停止过。一个阵营认为找到PCSK9这样的优质靶点或者苯并二氮卓这样的优质骨架事半功倍,所以从海量文献中去找这类优质种子是一个前沿。最近人工智能(AI)的大潮进入靶点发现领域,据说已有>200家小型企业以AI作为平台、其中以Insitro最为著名。另一个阵营认为药物是训练出来的,TNF抗体失败了败血症才去抗炎、PD-1抗体最早是作为艾滋病药物、更不要提伟哥这种纯粹意外发现。所以你手里有柠檬还是西红柿并不重要,重要的是拿到柠檬需要知道用它来做柠檬水、拿到西红柿要知道做番茄酱。最近一个叫做Protodigm的公司成立要帮助药厂提高决策质量。
当然任何一个策略执行到极致都可以胜出,如同冠军球队既可以是进攻型也可以是防守型。现在从科技杂志到专利文献都在指数增长,没有任何一个公司或科研机构有足够的人力阅读所有分析数据。AI虽然现在智力还达不到人的水平、但阅读速度却是任何人都无法比拟的,所以如果AI经过足够训练是可以在非常大范围内寻找有用信息和模式。但新药发现的每一步都非常复杂,尤其是靶点发现。AI的终极目标是能与人脑一样聪明、但现在还需要大量人工培训。遗憾的是人脑在新药发现中的劣势不在于阅读量不够、而是穿透力不足,即使有超人能一天读完所有文献并熟知新药研发整个过程还是不一定能找出下一个PD-1。
所以制药业需要颠覆性靶点,但AI更适合做me-too药物。现在上市药物靶点不超过1000个,理论上我们可以把这些靶点临床概念验证前的所有相关数据和其它信息提炼出来训练AI,如果这里面有可重复的模式AI应该可以找出下1000个成药靶点。这里面有些模式是肯定有预测能力的、比如如果看到默沙东突然把一期临床人数从100增加到1000,这十有八九是个重要可成药靶点、但这不需要AI也能做到。有些模式虽然是真正驱动但不一定能重复,比如碳酸锂的毒性被错误解读为镇静疗效、但不能依赖错误解读作为前进依据。
在这些极端事件之间还是可以富集一些比背景噪音成功几率更大靶点,比如人体基因学、动物基因敲除、RNA干扰都显示剂量相关一致表型变化的靶点比没有这些数据或者有数据但相互矛盾的靶点成功可能更大,这也是现在人工在做的工作、但做的不一定完全彻底。现在的AI可以比较详尽地把人体约2万基因与约25万种表型和1万种疾病相关数据从海量文献中提取出来,并已有一些数据库。但如何给这些证据质量打分、哪些可靠哪些不可靠,尤其是判断哪些是因果关系哪些只是相关关系连专家分析都一头雾水,让魔法师的门徒去决策显然不现实。所以虽然阿尔法狗所向披靡,但IBM Watson却黯然收场。收集数据容易,但把数据变成知识、把知识变成智慧现在还需要人的参与。
Protodigm的逻辑是药物成功与否主要看你如何调教,制药业的瓶颈不在于靶点太少或者靶点不够好、关键是如何根据不断积累的数据找到最佳用途。这当然有很多支持的例子,因为几乎所有的重要药物都有过九死一生的经历,但PSCK9也可以作为一个有力的反证。Protodigm虽然没有公布细节但估计也不外乎更严格在多维度评价药物和靶点的可靠性和价值。这虽然是专家的特长、但理论上也是可以由AI完成的,尤其是p53这样将来可能成药、现在公开信息很多的靶点。显然如果AI能把可能的千里马先圈起来,伯乐的工作要轻松很多。
美中药源原创文章,转载注明出处并添加超链接,商业用途需经书面授权。★ 请关注《美中药源》微信公众号 ★