新闻  |   论坛  |   博客  |   在线研讨会
以大模型加速新药研发,成本降低70%:一家大厂的「云端」实战(2)
机器之心 | 2023-05-20 16:53:35    阅读:115   发布文章

打造新药研发领域的「EDA 软件」


不只有面向药物分子设计的行业大模型,一直以来,华为云还在做一件更长期主义的事:打造新药研发领域的「EDA 软件」。
业内有一个判断:「未来的 AI 制药,正从以算法为中心(Model-centric)朝着以数据为中心(Data-centric)的竞争趋势演进,而高质量大数据是医药研发的竞争关键。」
新药研发的核心高质量数据通常掌握在药企手中,然而大部分药企特别是中小企业仍处于传统医药研发阶段,缺乏人工智能及大数据分析手段的支撑。海量的原始数据未经过系统化的清洗整理,大多不能产生良好的预测效果。
数据的价值需要使用算法去发现,同时结合 AI 新药研发公司成熟的算法,而算法需要运行在算力平台上。在这种情况下,就需要一个高效的企业级 AI 辅助药物研发平台将三大要素有机结合起来。
如此一来,不仅能够提高药物研发的效率、节约成本,还能大大降低药物研发的门槛,让每一家药企都能高效转型。
为此,华为云在医药领域自下而上构建了 IaaS、PaaS、SaaS 三层服务:基于分布式云基础设施,在药物研发环节为药企提供融合大数据、AI 能力的一站式 AI 辅助药物研发平台,并且根据多样性的数据治理和 AI 开发需求,提供全链路药物研发数据治理能力和全流程药物研发 AI 开发能力,帮助众多药企降低 AI 开发门槛和提升研发效率  。

图片


具体来说,在 SaaS 层,华为云的一站式 AI 辅助药物研发平台涵盖了「靶点发现」、「药物筛选」、「分子优化」三大核心服务,覆盖新药研发全流程,支持从靶点发现、虚拟筛选、先导化合物优化到获取可合成先导化合物的全业务流程,真正做到了「无功能断点」。
例如,传统的靶点发现需要做大量的科研工作,对靶点做大量的生物学假设,并设计一系列的实验进行验证,需要漫长的周期。在这一环节,华为云发布了 AutoGenome 单组学自动 AI 建模、AutoOmics 多组学自动 AI 建模、AutoGGN 调控网络自动 AI 建模三个框架,即使是没有机器学习背景的研究人员,也可以借助这些自动化调优的方法和策略对自己研究的问题和数据进行建模

图片


再谈到药物筛选,传统方法通常是借助实验手段或采用高通量实验筛选平台进行筛选,不仅耗时、耗钱,而且多样性差。华为云的一站式 AI 辅助药物研发平台则大大加速了这一早期筛选过程:平台预置了药物虚拟筛选流程和分子库,依托于华为云弹性扩容算力,支持并行化地完成海量的药物虚拟筛选,同时支持小分子和多肽分子对接,提供了打分矩阵、集成可视化。

图片

药物虚拟筛选结果案例展示。
一个具备代表性的案例是,新冠疫情爆发之后,由于没有实验提出新冠病毒相关靶点,研究人员很难进行相关业务设计。当时,华为云和国内几所高校积极开展新冠肺炎药物筛选工作,基于华为云 15000 核超大算力,完成了新冠 21 个蛋白质靶点与 8500 个已上市药物的筛选工作。原本耗时一个月的药物虚拟筛选,最终缩短到一天完成。
对于分子优化环节,传统方法更加依赖资深的药化专家在漫长职业生涯中积累的经验,对化合物进行改造,并需要进行实验验证,项目的成功极其依赖药化专家的经验和运气,而华为云提供的盘古药物分子大模型将这一阶段的工作进行了拆解,提供了多种自动化工具。
模型以参考化合物为起点,使得从参考化合物到改造化合物的类药性质一览无余,更方便地迭代优化,得到性质更优、结构新颖的化合物。这些丰富的功能意味着,如果一位药企的研究人员积累了大量关于某种毒性的试验数据,就可将试验数据上传并通过盘古药物分子大模型基于它的试验数据进行 Fine-tune 调优,直接可以在八十多种分子属性里面再加上新的自定义分子属性。
「算法只是一种技术的架构,一方面算法需要数据的训练来实现真正的业务需要,另一方面,就像 ChatGPT 一样,只有足够多的数据输入才能实现算法的最好性能,最后,算法的领先性需要持续的数据输入和迭代。所以未来 AI 制药的竞争是 AI 算法和药企数据的深度结合,实现干(计算,Dry Lab)湿(实验,Wet Lab)结合,循环迭代的大模型。」
SaaS 化服务的好处在于,药企只需订阅这一平台,就可以立即将其应用到自身的业务中,不用考虑他要雇多少人去开发、维护平台,也不需要考虑怎么引入新的技术方法。这种模式对于药企来是最直接、最快速的提升,意味着可以将重心、核心、精力聚焦于自身的业务层。
在将最新的技术和方法引入到平台的同时,华为云团队也特别注重将客户需求和建议融入平台。为了应对不断变化的需求,「AI 辅助药物研发平台」每年平均迭代、更新几十次,华为云派出专业的研发团队让药企的算法模型服务持续从业务中获得反馈以进行更新,确保药企可以方便快捷地将最新的技术应用起来,最终加速创新药的研发。
数据、算法、算力,构成了 AI 技术发展的三大要素,三者之间密不可分。例如,还有一些挑战依旧是药企最担心的:比如药物设计阶段产生的大量数据如何存、怎么用?算力资源的局限如何突破?
面向客户在「数据」和「算力」两块的升级需求,华为云也给到了专门的解决方案:通过全链路药研数据治理服务,在集成、存储、转换、分析、治理等全生命周期帮助医药企业进行自动化、智能化的数据治理,实现外采数据统一管控、干实验数据跨团队共享、干 / 湿实验数据整合闭环,并以中心化数据安全策略覆盖全链路,为药物研发提供高质量、高可信数据;此外,在算力方面,华为云提供医药行业分布式云基础设施,为药物研发提供最强算力底座和极致算力性能,通过高安全、高可用、高性能、国产化、大算力的云计算资源,保障生物医药企业数字化建设的数据安全性、系统合规性、研发稳定性、资源弹性。
让「AI for Industries」走到千行百业的深处
从目前的阶段来看,AI 制药对于制药行业仍是一门颠覆式的创新技术。长远来看,AI 技术广泛应用于制药行业的是必然趋势,以传统实验为唯一的药物发现过程必将逐渐过渡为以数据驱动的范式。
中国的制药行业是一个饱和的市场,对于每一家药企来说,创新药的研发将成为下一阶段取胜的关键。接下来的路怎么走,仍然值得探讨。
在取得一系列成果之后,华为云已成为 AI 新药研发赛道的「实力玩家」,越来越受到行业伙伴的关注。基于此,多方机构联合起来探索一种科研机构、医药产业链、华为云等「产学研用」紧密结合的模式,成为了众望所归。
在近日举办的华为云 AI 新药研发论坛中,由昌平区管委会、昌发展、华为云共同建设的「生命谷健康云创新中心」正式揭牌。

图片


该中心投入运营后,华为云也将基于人工智能等云计算能力持续汇聚各方力量,更有效地服务药企,帮助京津冀 TOP 药企实现突破性创新,提升京津冀生物医药产业在全国的知名度,并将合作模式辐射至全国各生物医药产业园区。
华为云 EI 服务产品部部长尤鹏表示,AI制药技术使得漫长的「马拉松」转向「加速跑」,华为希望以自身数据、算法、算力三方面的积累,以生命谷健康云创新中心为起点,未来服务于全国100+生物医药产业基地,推动中国新药研发高质量高速发展。
在新药研发领域的历史性变革中,像华为云这样的头部企业,正在对中国 AI 新药研发事业起到重要的推动作用。在我国生物医药产业链和产业集聚的形成过程中,「生命谷健康云创新中心」模式也将成为一种值得关注的创新路径。
最后,当大模型成为全新的风口,我们更需要思考的是,动辄十亿、百亿参数的大模型能在何种程度上改变社会,实现路径又是怎样的。
作为国内率先投入大模型研发及落地的机构,华为云认为,未来的三年将会是大模型是风起云涌的三年,AI 将会和各行各业深度结合,「AI for Industries」将是主要方向。
基于盘古基础大模型,华为云正在向各行各业提供盘古行业大模型服务,陆续推出了矿山、药物分子、电力、气象、海浪等盘古行业大模型,为业界贡献先进的算法和解决方案。

图片


未来,参照已经实践的大模型服务模式,华为云希望继续将最前沿的一批 AI 技术复制到千行百业之中去,推动人工智能开发实现从「作坊式」到「工业化」升级。


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客