向AI要“蛋白质”

本刊记者 谢玮

团队正进行湿实验验证  受访者|供图

在上海天鹜科技有限公司的一间实验室里,65摄氏度的恒温罐中,一种经过特殊设计的酶正在快速分解塑料瓶碎片。短短数小时后,这些塑料将被彻底“消化”。

这款耐高温的塑料降解酶,并非源自自然界筛选,而是由人工智能大模型挖掘、优化而成。

“过去,想要改造一个蛋白质,好比大海捞针。”天鹜科技首席技术官刘灏告诉记者,“举例来说,一个由361个氨基酸组成的蛋白质,仅替换1个氨基酸就有近7000种可能;替换2个便增至2300多万种;若替换3个,可能性更是高达约533亿种。”

如今,这一困局正被人工智能技术打破。

8月,工业和信息化部公布了第一批人工智能在生物制造领域典型应用案例,天鹜科技的“蛋白质工程大模型AIACCLBIO™”入选优秀案例。

这个由上海交通大学孵化出的科创企业,正在“向AI要蛋白质”——依托其自主研发的AI蛋白质设计大模型AIACCLBIO™,实现更精准、更高效的蛋白质设计与改造。

从“大海捞针”到“精准预测”

蛋白质是生命活动的主要承担者,也是工业与医疗领域不可或缺的重要原料。日常生活中,从洗衣液中高效去渍的酶,到生长激素、抗体药物,再到面膜中的胶原蛋白、诊断试剂中的检测酶,蛋白质产品早已广泛应用于众多领域。

然而,天然蛋白质往往难以满足工业化生产的需求。例如,人体内的蛋白质在37摄氏度、中性环境下活性最佳,但工业生产过程可能需要蛋白质在高温、强酸或强碱条件下仍然保持稳定活性。因此,对蛋白质进行设计与改造,以适应多样化应用场景,成为提升其工业适用性的关键。

“传统蛋白质改造主要依赖专家经验与大量试错,例如我的一位同学花了整整5年才成功改造了一个蛋白质。”刘灏说,“培养一位合格的蛋白质工程师需要5年,完成一次成功改造可能又需要5年,可以说是周期长、成本高、成功率低。”

人工智能技术的介入改变了这一现状。2024年,凭借人工智能模型AlphaFold2在蛋白质结构预测领域作出的贡献,AlphaFold2的开发者戴米斯·哈萨比斯和约翰·江珀获得诺贝尔化学奖。该模型解决了一个已有50年历史的难题,能够预测大约2亿种已知蛋白质的复杂结构。

“功能是一个蛋白质成为产品的关键,也是企业真正关心的核心。”刘灏说,天鹜团队选择了一条更直接的路径——训练AI大模型跳过结构模拟,从序列预测和设计蛋白质功能入手,“找出真正对企业生产有用的蛋白质”。

团队构建了包含近90亿条序列的蛋白质数据集。这些数据不仅涵盖常规生物蛋白质序列,更依托溟渊计划采集了从火山、深海海沟等极端环境中采集的耐高温、耐酸碱的蛋白质序列。其中,近5亿条带有功能标签,标注了蛋白质在特定温度、酸碱度、压力下的性能表现。

基于这些数据的训练,AI模型逐渐掌握了蛋白质序列与功能之间的映射关系,能够快速高效地优化改造蛋白质。

“它知道耐碱的蛋白质‘长什么样’,耐热的又有什么特征。当一个普通蛋白质缺乏这些特征时,AI可以为它‘添加’相应功能。”刘灏比喻道,“就像我们不需要知道一个机器的每个零件长什么样,只要知道输入什么、能输出什么,就能有效利用它工作。”

这一技术突破,使得设计能够适应各种极端工业环境的高稳定性蛋白质成为可能。

4个月,让蛋白质“不怕碱”

在AI助力之下,生物制造过程正在变得“多快好省”。天鹜科技与国内生长激素龙头企业金赛药业合作,成功破解了生产工艺中的一项纯化难题。

生长激素是一种蛋白质药物,在生产纯化过程中需要借助一种特殊的蛋白质作为“抓手”,将目标分子从混合液中精准分离。这个过程需要在极强的碱性条件下进行,pH值高达13~14。

“在极强的碱性环境下,大多数蛋白质会迅速失活。把一只虾放进这种溶液,15分钟后就会变红,像是被煮熟了一样。”刘灏说,企业原来使用的蛋白材料在这种条件极易变性,需频繁更换,成本高昂。

利用AI大模型,天鹜科技仅用4个月就完成了该蛋白质的改造,使其耐碱性提升了4倍,使用寿命延长一倍。

随后,该“耐碱”蛋白成功完成5000升规模的放大生产,成为全球首个实现工业化生产的大模型设计蛋白质。这一突破每年为合作企业节省成本超千万元。

刘灏介绍,在另一项酶改造项目中,一位物理学背景的博士凭借AI大模型的辅助,成功完成了设计任务——他没有传统的生物学经验,而是直接利用AI大模型对目标蛋白序列进行优化。

在极少的实验数量内,团队便获得了性能优异的蛋白质变体,大幅缩短了研发周期与成本。这在传统实验模式下难以想象。

自2021年9月成立至今,天鹜科技已经成功交付30余个蛋白质设计项目,覆盖创新药、体外诊断、工业酶制剂、合成生物学等多个领域,取得不少成果。例如,天鹜科技与瀚海新酶合作开发的胰腺炎检测原料酶,成本降至进口产品的十分之一……

目前,天鹜科技还有40余个在研项目,致力于运用AI技术帮助更多实体企业在产量和质量方面实现突破。

“人工智能+”重塑科研范式

从实验室到生产线,在生物制造领域,“人工智能+科学技术”不再是抽象概念,而是实实在在的产业变革。

“人工智能正在改变生物制造的研发范式,”刘灏说,“AI自动设计+
少量实验验证”的新模式,能够将蛋白质设计周期从2~5年缩短至2~6个月,实验样本数量从成千上万个减少到100个左右,项目成本从千万元级别降至百万元以内。与此同时,研发成功率也实现跨越式提升——传统方法仅0.1%~1%,而AI精准设计可达30%。

在刘灏看来,人工智能带来的不仅是技术迭代,更是科研范式的转变。它通过处理人类难以驾驭的海量数据,发现其中隐藏的规律,极大提升了研发的确定性和效率。

人工智能和科技研发结合所带来的巨大潜能,正持续为生物制造及其他众多领域创造前所未有的新机遇。

(本图为创意性构想,画面由AI生成)

顶部