最近几年,AI 加持下的新药研发成为被寄予厚望的赛道之一。
药物发现
、临床前研究、临床研究、审批与上市四个阶段。医药界有一个「双十定律」的说法 —— 即
需要超过 10 年时间、10 亿美元的成本,才有可能成功研发出一款新药
。即使如此,也只有约 10% 新药能被批准进入临床期。
药物发现
阶段。挑战在于,虽然 AI 技术加快了一部分工作的推进速度,但 AI 技术与药物研发的 “联姻” 并不是一蹴而就的,囿于算法低效、数据割裂、数据安全、算力瓶颈等挑战,药物研发仍然是一项高风险、长周期、高成本的工作。
人工智能
技术发展的三大要素,也在某种程度上决定了 AI 新药研发能够以何种速度走到最后一步。研发团队需要具备的条件很多:大量数据资源、充足的算力以及强大的技术积累。
在这样的情况下,在数据、算法、算力三方面均有深厚实力的大厂似乎更能扛起这份责任。
盘古药物分子大模型,为新药研发提质增效
华为
云的合作机会让他看到了新的可能。
华为
云在 2021 年正式推出了盘古药物分子大模型,这是当前业界
参数
最大的药物分子大模型,主要面向药物研发领域,提供结合预测、属性预测、分子优化与生成能力。
华为
云盘古药物分子大模型对 Drug X 的研发提供了重要帮助。
最终,在 AI 大模型的加持下,Drug X 先导药的研发周期获得了数十倍的加速,从数年缩短到数月,研发成本直接降低了 70%。
华为
云盘古药物分子大模型接受了超大规模的化合物表征模型训练,预先对 17 亿个药物分子的化学结构进行了学习,并对药物分子结构进行预测、打分。实验结果表明,
华为
云盘古药物分子大模型的成药性预测
准确率
比传统方式高 20%,帮助科研人员省去大量药物设计的成本。此外,该模型还内置了高效的分子生成器生成了 1 亿个创新的类药物小分子筛选库,结构新颖性达 99.68%,为发现新药创造了更多可能性。
盘古药物分子大模型框架。图源:https://www.biorxiv.org/content/10.1101/2022.03.31.485886v1.full
华为
云团队在模型架构设计及验证、大规模百卡昇腾 NPU 的训练都遇到过挑战,最后都一一解决了。」
华为
云 EIHealth 医疗智能体负责人乔楠博士介绍说。
华为
云团队首创了名为「图 – 序列不对称条件自编码器」的架构,将药物分子结构转换成可
量化
的数值,可以更好地在数值空间定量地对药物分子结构与性质进行预测与推荐。在 AI 优先推荐的药物分子基础上,科研人员可直接选择评分较高的药物分子进行人工实验验证。
深度学习
架构,图部分采用了图
深度学习
、图卷积的方法,序列部分采用了 Transformer 架构。」乔楠博士表示。
盘古药物分子大模型的图 – 序列不对称条件自编码器架构。
华为
云团队对盘古药物分子大模型进行了多项测试,结果表明,该模型在化合物 – 靶标相互作用预测、化合物 ADME/T(吸收、分配、代谢、排泄、毒性)属性评分、化合物分子生成与优化等 20 余项
药物发现
任务上实现了 SOTA(性能最优),可赋能
药物发现
全链条任务。
华为
云能力,将药物设计效率提升 1/3,分子优化后结合能提升 40%,加速肿瘤领域药物研发创新研究。
打造新药研发领域的「EDA 软件」
华为
云还在做一件更长期主义的事:打造新药研发领域的「EDA 软件」。
人工智能
及大
数据分析
手段的支撑。海量的原始数据未经过系统化的清洗整理,大多不能产生良好的预测效果。
数据的价值需要使用算法去发现,同时结合 AI 新药研发公司成熟的算法,而算法需要运行在算力平台上。在这种情况下,就需要一个高效的企业级 AI 辅助药物研发平台将三大要素有机结合起来。
华为
云在医药领域自下而上构建了 IaaS、PaaS、SaaS 三层服务:基于分布式云基础设施,在药物研发环节为药企提供融合大数据、AI 能力的一站式 AI 辅助药物研发平台,并且根据多样性的数据治理和 AI 开发需求,提供全链路药物研发数据治理能力和全流程药物研发 AI 开发能力,帮助众多药企降低 AI 开发门槛和提升研发效率 。
华为
云的一站式 AI 辅助药物研发平台涵盖了「靶点发现」、「药物筛选」、「分子优化」三大核心服务,覆盖新药研发全流程,支持从靶点发现、虚拟筛选、先导化合物优化到获取可合成先导化合物的全业务流程,真正做到了「无功能断点」。
靶点发现
需要做大量的科研工作,对靶点做大量的生物学假设,并设计一系列的实验进行验证,需要漫长的周期。在这一环节,
华为
云发布了 AutoGenome 单组学自动 AI 建模、AutoOmics 多组学自动 AI 建模、AutoGGN 调控网络自动 AI 建模三个框架,
即使是没有
机器学习
背景的研究人员,也可以借助这些自动化调优的方法和策略对自己研究的问题和数据进行建模
。
药物筛选
,传统方法通常是借助实验手段或采用高通量实验筛选平台进行筛选,不仅耗时、耗钱,而且多样性差。
华为
云的一站式 AI 辅助药物研发平台则大大加速了这一早期筛选过程:平台预置了药物虚拟筛选流程和分子库,依托于
华为
云弹性扩容算力,支持并行化地完成海量的药物虚拟筛选,同时支持小分子和多肽分子对接,提供了打分矩阵、集成可视化。
药物虚拟筛选结果案例展示。
华为
云和国内几所高校积极开展新冠肺炎药物筛选工作,基于
华为
云 15000 核超大算力,完成了新冠 21 个蛋白质靶点与 8500 个已上市药物的筛选工作。原本耗时一个月的药物虚拟筛选,最终缩短到一天完成。
分子优化
环节,传统方法更加依赖资深的药化专家在漫长职业生涯中积累的经验,对化合物进行改造,并需要进行实验验证,项目的成功极其依赖药化专家的经验和运气,而
华为
云提供的盘古药物分子大模型将这一阶段的工作进行了拆解,提供了多种自动化工具。
华为
云团队也特别注重将客户需求和建议融入平台。为了应对不断变化的需求,「AI 辅助药物研发平台」每年平均迭代、更新几十次,
华为
云派出专业的研发团队让药企的算法模型服务持续从业务中获得反馈以进行更新,确保药企可以方便快捷地将最新的技术应用起来,最终加速创新药的研发。
华为
云也给到了专门的解决方案:通过全链路药研数据治理服务,在集成、存储、转换、分析、治理等全生命周期帮助医药企业进行自动化、智能化的数据治理,实现外采数据统一管控、干实验数据跨团队共享、干 / 湿实验数据整合闭环,并以中心化数据安全策略覆盖全链路,为药物研发提供高质量、高可信数据;此外,在算力方面,
华为
云提供医药行业分布式云基础设施,为药物研发提供最强算力底座和极致算力性能,通过高安全、高可用、高性能、国产化、大算力的
云计算
资源,保障生物医药企业数字化建设的数据安全性、系统合规性、研发稳定性、资源弹性。
让「AI for Industries」走到千行百业的深处
药物发现
过程必将逐渐过渡为以数据驱动的范式。
华为
云已成为 AI 新药研发赛道的「实力玩家」,越来越受到行业伙伴的关注。基于此,多方机构联合起来探索一种科研机构、医药产业链、
华为
云等「产学研用」紧密结合的模式,成为了众望所归。
华为
云 AI 新药研发论坛中,由昌平区管委会、昌发展、
华为
云共同建设的「生命谷健康云创新中心」正式揭牌。
华为
云也将基于
人工智能
等
云计算
能力持续汇聚各方力量,更有效地服务药企,帮助京津冀 TOP 药企实现突破性创新,提升京津冀生物医药产业在全国的知名度,并将合作模式辐射至全国各生物医药产业园区。
华为
云 EI 服务产品部部长尤鹏表示,AI制药技术使得漫长的「马拉松」转向「加速跑」,
华为
希望以自身数据、算法、算力三方面的积累,以生命谷健康云创新中心为起点,未来服务于全国100+生物医药产业基地,推动中国新药研发高质量高速发展。
华为
云这样的头部企业,正在对中国 AI 新药研发事业起到重要的推动作用。在我国生物医药产业链和产业集聚的形成过程中,「生命谷健康云创新中心」模式也将成为一种值得关注的创新路径。
参数
的大模型能在何种程度上改变社会,实现路径又是怎样的。
华为
云认为,未来的三年将会是大模型是风起云涌的三年,AI 将会和各行各业深度结合,「AI for Industries」将是主要方向。
华为
云正在向各行各业提供盘古行业大模型服务,陆续推出了矿山、药物分子、电力、气象、海浪等盘古行业大模型,为业界贡献先进的算法和解决方案。
华为
云希望继续将最前沿的一批 AI 技术复制到千行百业之中去,推动
人工智能
开发实现从「作坊式」到「工业化」升级。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...