5月22日,鲲鹏昇腾开发者大会2026(KADC2026)在京举行。本次大会上,昇腾、鲲鹏多项创新技术发布,涵盖鲲鹏与昇腾超节点架构创新、软件开源开放及易用性持续提升等。

面向Agentic AI时代,打造从好用到易用的昇腾AI算力底座
Agentic AI时代加速到来,智能体从被动响应迈向主动决策与协同执行,推动产业范式深度重构。面向预训练、推理Prefill与Decode等各类业务负载,AI芯片的算力、内存带宽、内存容量、互联IO带宽四大核心指标,在不同应用场景下优先级各有差异。此外,尤其是互联的能力直接决定了超节点的能力。通过昇腾950芯片优异的互联能力,可构建出更高带宽、更低延时,以及覆盖范围更大的超节点。昇腾超节点天然亲和Agentic AI超大KV Cache、超低时延、超长上下文刚需,引领算力基础设施建设新范式。

华为公司Fellow、半导体首席科学家廖恒表示: 昇腾一直秉承从“芯片架构-系统架构-集群架构-软件架构”的深度协同,持续迭代硬件能力、优化CANN等基础软件,平衡生态兼容性与系统运行效率,为业界构筑坚实的算力底座。
CANN在全面开源开放的基础上,持续聚焦开发易用性提升及开箱性能,满足创新需求。在分层解耦与开源开放方面,CANN提供完善算子开发体系,实现多维开发自由:兼容PyTorch、vLLM等主流AI框架与Triton、TileLang等生态语言;开放加速库、算子编程及运行时接口,实现分层灵活调用;支持算子与通信库独立迭代升级;同时开放50+代码仓、800+算子,充分释放源码创新空间。
在兼容主流开源技术生态方面,昇腾以全面兼容主流开源生态为易用性改进核心方向,让开发者无需改变使用习惯即可高效调用昇腾硬件能力。算子编程层面,昇腾完成Triton、TileLang双引擎全面适配,兼顾开发者使用习惯,高效释放平台算力。AI框架上,昇腾全面支持PyTorch生态,实现2300多个API与社区对齐;图模式加速实现40+模型入图能力对齐,分布式加速实现20+主流大模型FSDP2开箱即用。训练加速方面,昇腾与8+强化学习社区建立合作,累计合入超万行代码。推理领域,昇腾全面适配LLM、多模态等核心场景。
此外,在Mind系列软件全面升级方面,MindSpore面向超节点创新,组件化解耦,提升昇腾大模型图模式、分布式竞争力;MindSpeed通过架构革新,解耦插件,灵活配合开源社区使用,快速使能昇腾算力;MindIE系列软件栈全新升级,与生态充分融合,助力推理更快、更稳、更简单;MindStudio开源开放并搭载智能助手,全流程提升了开发调试效率。
昇腾在开发者使能上全面升级,从社区体验、开发工具、激励权益三方面优化,降低AI开发门槛、提升创新效率。社区实现一键自动部署,开发者平均2分钟跑通首个Demo,免费算力与一站式平台即取即用;将数千名昇腾专家经验沉淀成skills,搭建Agent工作流,提供全新Agentic开发体验,开发者通过需求描述即可完成各类模型开发操作,大幅压缩开发周期;加大对开发者的激励投入,设立首批创新激励基金,扶持算子、加速库等领域创新探索,投放10000卡算力资源,支撑开源社区研发运维与实操体验,充分保障开发者算力需求。
鲲鹏与开发者共建Agentic AI时代IT基础设施新架构
在通用计算领域,鲲鹏开发者峰会展现从根技术探索到行业实践的全链路突破。围绕鲲鹏超节点架构、公有云智能体运行体系、科研智能体驱动的机器科学家系统、OpenCloudOS鲲鹏超节点创新实践以及大数据业务调优实践,联合社区与行业伙伴,构筑面向Agentic AI新时代IT基础设施的理想选择。

华为公司Fellow、ICT操作系统副首席科学家胡欣蔚表示,算力底座不再仅为模型训练设计,而是面向Agent负载重塑,华为正在构建以鲲鹏为底座的三层智能体系,实现智算-通算异构融合与软硬协同,为大规模智能体应用提供坚实的算力基石,让智能触手可及。
回顾鲲鹏生态七年发展历程。自“硬件开放、软件开源、使能伙伴、发展人才”战略发布以来,鲲鹏先后开源openEuler、openGauss、openUBMC、openFuyao,发布灵衢协议,并将迎来BoostKit的全面开源。截至目前,鲲鹏已携手7000余家生态伙伴,联合孵化27000余个鲲鹏解决方案,积累了415万名专业开发者。
基于全新架构升级,鲲鹏超节点带来核心性能与算力体验的全面突破。其以TB级互联带宽、百纳秒时延和全局内存统一编址,重构大数据、数据库、推理等场景。
面向Agent构筑高密度低时延高并发的沙箱基础设施,鲲鹏超节点依托多级缓存共享架构,结合增量快照共享与任意状态快速fork能力,回滚性能达十毫秒级,可支撑Agent任务成功率提升10%以上。
在鲲鹏通信加速底座上,采用三项关键技术:灵衢SGL特性降低20%通信时延;透明UBSocket无需修改应用源码,时延再降40%;共享TP技术多连接复用同一传输层连接,降低90%通信内存占用。
此外,鲲鹏超节点是具有极致性价比的AI数据底座,其借助共享内存实现Buffer Pool预热和快速加载,分布式全局图索引技术使多模态检索性能翻倍,通过上下文缓存减少重复注入,实现Agent业务Token开销降低50%。
在Agent安全方案上,鲲鹏推出基于CCA架构的机密Agent方案。Agent运行于机密虚拟机中,结合eBPF技术实现容器级可信授权,基于CCA机密计算架构防御内存dump攻击,并利用自研内生密码模块与openGauss回滚技术实现重要数据加密存储及秒级恢复。
面向Agentic AI时代,鲲鹏与昇腾将持续以技术创新筑牢算力底座,以全面开源降低开发门槛,与广大开发者携手并肩,共建算力新高地,同启智能新征程,共赢AI新时代。
编辑:孙冰