这颗“中国芯”,走出“中国路”

本刊记者 周琦

这是AI大模型算力需求爆炸式增长的时代。提供算力的AI芯片正面临“效率墙”“互联墙”“存储墙”的三重挑战。

中国在芯片赛道上如何赢得优势?国产替代的关键在哪?近日,清微智能创始人王博在接受《中国经济周刊》记者采访时,对这些问题一一解答。

这家被誉为“清华AI双子星”的企业,正以原创的可重构AI芯片(RPU)为突破口,在国产芯片赛道探索出一条差异化新路线。

图片

清微智能TX81芯片

AI芯片两大门派:GPU和数据流

“可重构AI芯片RPU是区别于GPU的另一大AI芯片技术流派——‘数据流派’的典型代表。它的原理就像铁路‘扳道岔’,铁轨换成了芯片里的计算单元。”王博抛出一个形象比喻,“传统芯片是固定轨道,只能跑一种‘火车’;可重构芯片有无数电子‘道岔’,能随时切换计算单元连接方式,让同一颗芯片适应语音识别、图像分析、训练推理等不同任务。”

这种动态重构能力,让可重构芯片与GPU相比,可以实现更高的算力效率、可扩展性、并发能力和性价比。

华泰证券海外科技首席、执行董事何翩翩认为,可重构芯片的长期价值和增长潜力来自其为特定AI工作负载提供卓越性能和效率的能力。“后续能否建立起强大的软件生态系统决定其能否吸引开发者从现有GPU生态转向。”何翩翩表示,尽管英伟达为代表的“GPU派”主导地位不易被撼动,但新兴的可重构数据流架构正在AI芯片领域开辟重要的市场,并推动着创新向前发展。

国际半导体技术路线图(ITRS)将可重构芯片列为“未来最具前景芯片架构技术”,可重构芯片已被学术界和产业界视为CPU、FPGA和GPU之外的第四类通用计算芯片。

王博透露,清微去年量产的云端算力芯片TX81,在同等1000P算力规模下相比GPU集群具备更强的互联和效率优势,一经推出市场反响强烈,半年多时间已在国内落地多个百卡、千卡智算中心。截至目前,算力卡订单累计近20000张。

放眼全球,以可重构数据流为代表的“数据流派”呈现蓬勃发展态势。美国斯坦福大学孵化的公司SambaNova,通过自研的可重构芯片产品成为AI芯片独角兽企业,其产品能够支持5万亿参数模型训练,推理性能上,其8芯配置性能为英伟达H100的3.1倍;美国芯片初创公司Groq开发的张量流式处理器架构LPU(Language Processing Unit),推理速度相较于英伟达GPU提高10倍,成本仅为十分之一;特斯拉在专为AI训练自研的‌Dojo超算系统‌中也采用了该类型芯片架构,成为特斯拉实现FSD智能辅助驾驶系统的核心基础设施。

近期,全球最大的人工智能芯片客户之一OpenAI开始租用谷歌TPU芯片,TPU也是数据流芯片的典型代表。对此,王博认为这个信号对于AI的长期发展是有利的。全球AI算力需求增长迅猛,高度依赖单一厂商或单一技术路径的局面,会限制技术的竞争演进。

王博表示,好的技术生态就像江湖中的武林门派,既有合纵连横,也能各显神通。“GPU”和“数据流”就像是AI芯片界的少林武当,以谷歌TPU、清微RPU为代表的新技术流派近年来逐渐站上“华山之巅”,有利于推动全球AI产业健康可持续发展,就像汽车产业发展也曾经历燃油车、电动车、混动车等多个技术路径并行发展的阶段。

“后面的故事大家都看到了,电动车通过智能化、网联化和制造工艺的变革实现追赶,与燃油车路线并驾齐驱,中国汽车产业更是借此在全球汽车产业实现‘换道超车’。”王博表示,人工智能时代,中国要实现算力产业真正的自主可控,在国际主流的两大技术流派上都应该有布局和发力。

图片

清微REX1032训推一体服务器

持续创新 中国 AI 和全球同频演进

“目前我们正在开展C轮融资。”王博透露,清微是国家集成电路产业投资基金投资的唯一新型架构算力芯片企业。公司此前也获得北京信息产业发展投资基金、国开装备基金等国资支持,商汤、蚂蚁等头部企业也对清微进行了资本与产业赋能。

在除GPU以外,另一大AI芯片发展路径上实现国际领跑,这是清微智能在中国算力产业版图中具有举足轻重地位的重要原因。截至目前,清微可重构芯片全球累计出货量超2000万颗。“国家队+产业链”的投资结构,也彰显了市场对可重构技术和清微智能的认可。2024年,清微智能入选首批国家级专精特新重点“小巨人”。

谈及企业成功的关键因素,王博语气中满是感慨:“清微智能的技术底座是依托清华大学可重构实验室近20年积淀。技术为本是刻在清微基因里的。我们500多人的团队用6年时间、数十亿元的研发费用,把可重构架构的芯片从0到1做出来,这是一个难以想象的浩瀚工程。”

刻在基因里的技术驱动力也让清微始终保持对新技术的敏锐洞察和坚定投入。近期,清华大学研究团队在2025国际计算机体系结构研讨大会(ISCA)上发表了国际上首个晶圆级芯片计算架构与集成架构协同设计体系,取得了国内外学术界与工业界的广泛认可。

“国际上已基本共识,晶圆级芯片是AI芯片的下一个主要迭代方向。”清华大学集成电路学院副教授胡杨介绍,晶圆级芯片能够在单位空间内集成更多单元电路,具有更高的晶体管密度与算力。同时,未经切割的晶圆上的电路单元与金属互连排列更紧密,从而形成带宽更高、延时更短的互连结构。“在相同算力下,由晶圆级芯片构建的算力集群占地面积对比GPU集群能够缩小10~20倍以上,功耗可降低30%以上。”胡杨表示。

华泰证券海外科技首席、执行董事何翩翩认为,随着AI芯片数量的增加,芯片间的互联速率成为主要瓶颈,严重限制了AI训练和推理的有效扩展。晶圆级芯片直接且根本性地解决了这一问题。这种设计实现了巨大的内部带宽和低延迟,特别是对于需要频繁数据交换的大模型的未来发展至关重要。

目前,全球仅有特斯拉、Cerebras两家公司推出了晶圆级芯片产品。王博透露,清微智能正在与清华大学联合推进国内晶圆级芯片的工程化设计和产品化落地。

“相比短平快的仿制路线,选择新架构实现‘换道超车’才是真正的高阶国产替代。”王博表示,清微智能押注未来3到5年的算力革命,实施“研发一代、储备一代、释放一代”的技术战略。其中,已释放的技术成果正在积极推进商业化落地;处于储备阶段的技术,聚焦未来几年可重构计算的技术升级需求;前瞻性研发则依据技术发展趋势,布局算力领域关键技术赛道。

“我们手中还有很多技术牌可以打。清微智能在可重构这个技术路径上的能力储备,在国内还没有同量级的选手,我们希望在第四次工业革命这一大变革时代,走出一条中国新路线,提供一种中国新方案。”王博对未来信心满满。


记者手记

走进清微智能的大门,我见到了王博。这位70后创业者散发着浓厚的工程师气息。简约的蓝衬衫,办公室布置得十分简洁。

采访一开始,王博便展现出言简意赅的风格。当被问及为何选择国产高阶替代这条布满荆棘的道路时,他沉默片刻,缓缓说道:“总要有人去走最难的路。”

图片

清微智能创始人兼CEO王博

这句朴实的话语背后,是他特有的使命感——明知从0到1的突破意味着资金压力、技术瓶颈和漫长周期,却依然选择迎难而上。

回溯过往,王博这批70后创业者成长于中国信息技术从萌芽到蓬勃发展的关键时期,他们亲历了全球技术浪潮的剧烈更迭,目睹了无数企业因技术滞后被时代淘汰,也见证了抓住技术变革机遇实现跨越式发展的传奇。

芯片的竞争是一场马拉松,每一家参与其中的企业都需具备长跑的心态和体质。纵观全球,英伟达成立32年,AMD走过56年历程,英特尔更是历经57年风雨,这些行业巨头的发展史无不印证,硬核科技领域的竞争,绝非一朝一夕的爆发力能制胜。创业者不仅要在技术浪潮奔涌时躬身入局,更需要在漫长的发展周期中,始终保持追赶的耐力及眼力,这或许正是阅尽千帆的70后创业者的优势所在。唯有坚持长期主义,才能在芯片产业的赛道上行稳致远。

顶部