AI在药物发现中的作用是否被过度夸大了?

AI百科6个月前更新 快创云
69 0

  导读:自2022年ChatGPT的横空出世,生成式人工智能在消费领域大放异彩,而深度学习和生成式人工智能在药物研发领域的进展,实则是在过去十年间逐步取得的。以英矽智能为例,早在2016年,我们发表了第一篇关于“将生成式人工智能应用于小分子生成”的同行评审论文。到了2019年,经过一年的审稿期,我们又发表了题为“使用生成式张量强化学习(GENTRL)生成分子——从概念到动物试验验证”的研究。

  如今,人工智能驱动的药物研发(AIDD)领域正在经历重大整合,一些投资者甚至因此损失了数十亿美元。过去十年间,我们看到了数百家旨在颠覆制药业的人工智能初创公司不断涌现。这些AIDD公司中,有些被过度炒作、已经失败、正在失败,或者已经转型为传统的生物技术公司。

  本文将探讨AIDD领域的炒作现象及其现状。

  最近,我们听到一些人工智能药物研发公司声称:生成式人工智能被过度夸大了,它们需要更多高质量的数据、更多资源、更强的计算能力或其他东西来兑现承诺。换句话说,这些公司一边试图降低业界的预期,一边试图以“现实主义者”、“资深人士”或“睿智大师”的身份吸引眼球。不出意外,这些公司大多在筹集了大量资金后,经过多年的技术开发,却未能凭借人工智能制药创造业界记录。

  通常被指为“炒作”的,是媒体宣传新公司或新产品的醒目标题,或是针对科学家宣称“AI将很快解决生物学问题,并治愈所有疾病”的声明。例如,有些人可能会批评主流媒体对AlphaFold的过度追捧,因为没有任何药物是利用这项突破性技术开发的。这种炒作有多危险?我们是否应该抵制?在我看来,媒体对科学和科学家的关注是一件非常积极的事情。在药物研发领域,需要华丽的头衔来吸引非科学受众的关注,实现对市场的基础教育。

  然而,另一种炒作非常危险——金融炒作。每一次技术革命都会引发一波媒体报道和资本追逐。被过度炒作的公司通常都是由著名风险投资家孵化的,他们有一个简单的公式:发现趋势,与许多初创公司交流以了解什么是有效的,精心制作一个引人入胜的故事,把几位大佬聚集在一起,用学术研究为其增色,然后联合大量资金进行融资。通常,这些公司会成为头条新闻,因为媒体自然而然地认为融资额、投资者声誉和大牌业界意见领袖将成为制胜法宝。

  在下一轮,这些公司与制药公司建立了一些高调的合作关系。这些公司“信守承诺”布局前期投入,吸引了养老基金的资金募集,并成为头条新闻。但是几年过去了,真正的药物还没有进入人体临床试验阶段,业界意见领袖们也会发生内部矛盾,然后离开去追求新的行业热点或退休。令人惊讶的是,媒体、投资者甚至是为这类公司叫好的制药公司都很少回顾过去并得出结论。

  制药业药物发现和开发的周期实在太长,而人们更换工作的速度往往快于失败的显现。许多业内人士致力于个人利益和事业而非真正的开发具有变革性意义的药物。这样的金融炒作非常危险不仅会导致预期落空和财富损失还会导致患者无法及时获得药物造成成千上万甚至数百万人的生命损失。

  在深度学习革命初期2013-2014年左右很难分清谁是谁。先驱公司们花了几年时间试错、发表论文并制定了标准。如今人工智能制药的准入门槛已经大大降低以英矽智能为例我们也探索出了端到端人工智能驱动药物发现的范例并在论文中披露了项目的大部分数据附上了时间表和说明使资深分析师和记者可以通过这些原始数据展开研究。遗憾的是对于评判人工智能制药公司的好坏大多数人仍然追随大牌业界领袖和高额募集资金而不是关注可衡量的结果和实验验证。

  为了避免危险的金融炒作最简单的方法是这些人工智能制药公司根据其取得的阶段性成果而非承诺和名人站台逐步获得资金。当公司准备好启动一定数量的1期或2期临床试验时才有理由进行大量的资金调配而不是更早去投入到不必要的基础建设中。例如如果公司需要计算资源时可以很容易地与云服务提供商合作而不是斥巨资建立自己的基础设施因为当一种药物进入临床时这些基础设施很可能就已经过时了。同样重要的是要通过实验验证来证明它们以人工智能驱动制药的真正能力。洛桑联邦理工学院、哥伦比亚大学和牛津大学的科学家们最近在Nature Machine Intelligence联合发表了一篇论文总结了生成化学领域的大多数实验验证研究并提供了一个评估“技术就绪程度”的框架。

  对此基于经验我也提出了一系列简单的问题以帮助评估在人工智能制药这一相当成熟的领域中的公司并估算其炒作与成果的比率:这些问题我通常会关注遗憾的是大多数记者、分析师甚至投资者很少问这些问题即使答案可以用一张小表或一张小图来概括。

  我想与大家分享一些英矽智能的内部基准但要声明的是这些基准只是参考不能用作财务建议或任何形式的招标。2020年我们发布了人工智能平台Pharma.AI该平台目前包括用于靶点发现和生物制剂设计的Biology42、用于生成化学的Chemistry42和用于临床试验分析的Medicine42。如今全球以营收计排名前 20 的制药公司中超过 10 家使用了该软件的全部或部分功能创造了每年数百万美金的软件收入并帮助不断验证和优化算法模型。

  在药物研发领域我们在Pharma.AI的支持下建立了一系列由新型疗法组成的多元化内部管线并将其对外授权给其他制药公司以充分展示人工智能制药软件的能力。值得一提的是这些项目通常需要更高水平的质量和独特性——对外授权项目的标准往往高于内部自研的项目。从 2021 年 2 月到 2024 年 5 月我们其中 9 个分子获得FDA或CDE批件进入临床试验阶段包括… 。仅在 2022 年我们就提名了 9 个临床前候选项目其中 8 个为内部项目1 个为制药合作伙伴项目。平均而言从立项到提名临床前候选化合物我们需要 11-12 个月的时间再推进到开启临床试验需要另外12个月左右的时间… 。

  我们的实践经验表明基于 18 个真实项目的研究数据人工智能可以将临床前开发时间缩短一半并提高成功概率… 。虽然现在还无法断言能否加速开发一种新疗法但对于人工智能驱动的生物技术来说从项目启动到开始人体临床试验18-24 个月应该是标准时间… 。但在临床阶段人工智能发现的药物没有捷径可走需要扎实地通过临床试验遵守FDA的所有规定为安全性和有效性提供令人信服的证据… 。要想提供令人信服的证据来证明生成式人工智能对药物发现的影响公司需要展示从靶点发现和药物设计到提供大片治疗药物的干净利落、有据可查的路径使大量患者受益而不仅仅是治疗一种罕见疾病… 。鉴于目前的行业状况如果没有战争或经济崩溃我预计这将在 2026 年至 2029 年间发生… 。遗憾的是关于药物研发的书籍屈指可数《十亿美元的分子:追寻完美药物》(The Billion-Dollar Molecule:The Quest for the Perfect Drug)是我最喜欢的书之一我希望几年后第一批真正利用人工智能发现和开发的药物获得监管部门批准后有人会讲述深度学习在药物发现中的故事… 。

© 版权声明

相关文章