12月1日,福布斯“2024中国新时代颠覆力创始人评选”榜单正式揭晓,分子之心创始人兼首席科学家许锦波凭借在AI蛋白质领域做出的颠覆性技术突破与产业推动贡献,入选该榜单。
“2024中国新时代颠覆力创始人评选”由福布斯中国携手GBRC(全球商业研究院)发起,聚焦于新一轮科技革命和产业升级这一全新时代中的创新创业前沿阵地,旨在通过呈现企业创始人代表在不同行业领域的创造性思维和颠覆性成果,激励更多人通过创新推动行业发展与社会进步。
作为榜单入选者之一,许锦波正是在AI与生物科技交融这一新兴领域做出创造性颠覆的杰出代表。他曾于2016年发明基于深度学习的RaptorX-Contact方法,全球首次证明AI可以大幅提升蛋白质结构预测精度,不仅让“蛋白质折叠”这一世纪难题的解决首次实现质的飞跃,更是突破传统研究方法、开创出AI for Life Science的全新研究范式,并对后来谷歌DeepMind开发AlphaFold产生了重要启发。此后,他又积极推动AI蛋白质技术的产业应用,率先将研究拓展至更有可能颠覆整个生物产业、乃至社会生产生活方式的AI蛋白质设计,并通过成立分子之心、集合一批全球顶尖水平AI+生物复合型人才团队,推动前沿技术对产业乃至社会发展的变革。
用AI攻破蛋白质结构预测难题,开创生命科学全新研究范式
如果将生命体视作一座精密的大工厂,DNA就是其中最原始的设计蓝图,蛋白质则是最终的产品,也是工厂中自动执行各种功能的“分子机器”,被人们称为生命的物质基础、生命活动的主要承担者。
然而,关于蛋白质的结构预测和设计研究,却成了“阳光下最难的科学问题”,困扰整个科学界近半个世纪。在AI方法出现以前,仅仅为了“看”清蛋白质是什么样子,也就是测出蛋白质的三维结构,传统生物学家就先后使用X射线、晶体衍射、冷冻电镜等多种方法进行尝试,却一直收效甚微,耗时长、花费高且成功率很低,相关研究成果至少七次获得诺贝尔奖,足见其难度与价值。九十年代后,通过计算机进行能量优化的方法逐渐兴起,但效果仍然有限。
2016年,许锦波开发出的RaptorX-Contact方法,通过使用更深的神经网络抓取蛋白质全局信息,一举实现蛋白质结构预测效果的飞跃。这一方法在“蛋白质奥林匹克”CASP比赛中,将始终徘徊在30分左右的蛋白质结构预测成绩突破至60分,而它的核心思想更是在随后被包括AlphaFold在内的其他研究团队采纳并发扬光大,推动AI蛋白质结构预测成果的井喷式爆发。
通过AI而非实验室观测的方式对蛋白质结构进行预测,自此改变了传统生命科学领域的研究范式,加速了人类破解“生命密码”的进程,许锦波因此被业界公认为“AI蛋白质折叠奠基人”。在今年诺贝尔化学奖颁出后,国际计算生物学会会士、曾任斯坦福大学计算机教授的塞拉菲姆·巴特佐格鲁(Serafim Batzoglou)就表示,许锦波应该共享2024年的诺贝尔化学奖,因为“他第一个开发出(精准预测蛋白结构)的深度学习算法,这一算法后来被复现和增强到最初版本的AlphaFold中”。
基于AI蛋白质设计实现生物“智”造,开启生物经济重构的大门
许锦波用AI突破蛋白质结构预测只是一个开始。在此基础上进一步发展而来的AI蛋白质设计,则更有可能对建立在生命科学基础上的生物医药、生物制造等产业进行底层逻辑重构,进而为生物经济发展创造全新价值。
这是因为,在理论上,通过漫长的进化,大自然可以将已知组成蛋白质的20余种氨基酸不断拼接、折叠。假设一个蛋白质由100个氨基酸组成,每个氨基酸与其他氨基酸相连时只有2种不同连接方法,那么所有可能的组合就达到了2的100次方种。即便是一台每秒能计算1亿种组合的超级计算机,要把这些所有的可能组合都算一遍,也需要4乘以10的14次方年,这个时间足够宇宙反复诞生29128次。但是,通过AI,人类则可以全面系统地探索上述已知的蛋白质空间,更有可能设计出自然界中不存在的超级蛋白,从而开发出新颖的药物、环保绿色的材料、优质价廉的食品等等,为社会生产生活方式的变革所用。
具体到生物医药、合成生物学等生物产业的重点领域中,一直以来,传统通过湿实验高通量筛选、从自然界“发现”具备理想功能蛋白质的方式,低效且成功率很低,成为产业快速发展的重大瓶颈。
而在AI的加持下,蛋白质设计将从一个科学问题变成一个可编程、可预测的工程问题,过去缓慢且充满不确定性、大海捞针式的生物制品研发,转变为按图索骥、按需定制式的产品创造,可编程药物、可编程材料、按需优化的超级催化酶将逐步变成现实。这种颠覆性技术为产业带来的新增量,不止是极大提升产业的研发效率、降低成本、提升利润,更将突破传统生物技术天花板,解决以往无法解决的极致难题,进而创造更多有市场竞争力的高附加值新产品。
许锦波同样是AI蛋白质设计的先驱者。在AI蛋白质结构预测取得突破后,他很快意识到AI蛋白质设计的产业价值,并在2018年前后于全球范围内率先开启相关研究,开发出多个经过湿实验验证的算法,不仅相关成果多次发表于国际顶级期刊,更是被国际知名药企、生物科技公司深度应用。同一时期,他也开始探索用预训练方式,也就是大模型的方法进行蛋白质设计。
为了更好地推动技术创新和更大范围的产业应用,2021年底,许锦波带着这些领先的技术能力返回国内,创立分子之心,并凭借他的影响力,很快聚集了一批兼具AI蛋白质研究经验和丰富产业实践经验的顶级复合型人才团队,核心研发团队博士占比90%以上,核心研发负责人均来自海内外顶尖高校和行业领军企业。
两年多时间里,分子之心陆续取得十余项全球领先的AI蛋白质预测、优化与设计技术突破,如全球首个AI蛋白质优化设计平台MoleculeOS,首个集成序列、结构、功能和进化的产业级AI蛋白质生成大模型NewOrigin(达尔文),精度超越AlphaFold 3的复合物结构预测算法,全球首创的可同时用于蛋白质侧链预测与序列设计的算法等。
这些革命性的AI蛋白质技术汇聚在一起,融合分子动力学、量子化学等科学计算方法,实现了蛋白质精准优化和设计,极大提升了抗体、酶、小蛋白、疫苗等各类型蛋白质性能优化和从头设计的效率及成功率。它们已在创新药研发、生物制造、新材料等领域的高难度产业任务中深入应用。
而在蛋白质元件设计的基础上,分子之心也开始与合作伙伴携手,探索将AI应用拓展到更多生物生产流程环节,希望通过系统性优化设计,提升研发速度和效率,为生物制造领域长久以来存在的研发周期长、成本高、选品风险高等瓶颈,提供更高效、更智能的解决方案,推动生物制造向生物“智”造的全面升级。
从AI蛋白质结构预测出发,到AI与生物制造产业发展的融汇,许锦波与分子之心还将持续突破边界,为生物经济的智能化变革、为绿色低碳生产生活方式的加速实现不断努力。