​昇思MindSpore 2.3发布:支持大模型开发训推更简、更稳、更高效
0
收藏
手机阅读
手机版

扫码手机端阅读

欢迎关注
经济网小程序

分享
新浪微博
微信

微信扫码分享

顶部


中国经济周刊-经济网讯 人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。3月22日,以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024在京举行,旨在汇聚AI产业界创新力量,推动根技术持续创新,共建人工智能开源新生态。

昇思MindSpore作为国内主流开源框架,打造充满活力的开发者社区,致力于推动中国人工智能产业的进步。近两年包括昇思MindSpore在内的开源框架产品不断发展,IDC的研究显示,昇思MindSpore在生态建设方面取得优异成绩。

中国工程院院士、中国人工智能学会副理事长何友表示:中国人工智能学会与昇思MindSpore紧密合作,携手鹏城实验室、昇思MindSpore开展学术基金2.0项目,加速推动基于昇思的原生学术创新及论文成果发表,发挥学术人才的原生力,结合昇思的技术原创力,以学术创新支撑人工智能产业繁荣。

华为ICT Marketing总裁周军表示:AI框架的并行计算能力、简洁编程能力、便捷部署能力等,逐渐成为大模型训练的关键成功要素。昇思将持续创新探索,聚焦根技术,以更开放的技术体系,让伙伴和开发者更灵活的实现大模型创新,加速大模型应用规模落地。

据悉,华为于2020年3月开源昇思MindSpore AI框架,开源后获得国内外开发者的积极响应,访问量数千万,超过687万下载安装使用,在码云千万开源项目中综合排名第一,服务企业数量超过5500家,合作高校360所。2023年以来,基于昇思框架发表的顶级会议论文数量超过1200篇,在所有AI框架中排名中国第一、全球第二,已成为国内最具创新活力的AI开源社区。

中国科学院院士、中国空气动力学会理事长唐志共表示:基于昇思MindSpore,生成式气动设计大模型平台打破传统设计范式,设计时长由月级缩短到分钟级,满足概念设计要求。未来该平台将扩展到航空、航天、船舶、高铁、能源、汽车等多个行业领域,引领工业装备的设计和制造能力跨越式发展。

同日,昇思MindSpore 2.3全新发布,将支持大模型开发训推更简、更稳、更高效。

据介绍,昇思MindSpore积极探索前沿技术,支撑大模型原生高效训练。通过原创的多副本、多流水交织等8种并行技术,使集群线性度达到90%(业界不足60%),通过整图优化及下沉执行等,使得算力利用率达到55%(业界不足40%);针对集群故障率高,恢复时间长的普遍问题,通过编译快照,确定性CKPT技术实现20分钟完成故障恢复。

在大模型部署上,昇思通过训推一体的架构升级实现脚本、分布式策略,运行时的统一,Baichuan2-13B的推理部署只需1天。在大模型推理上,通过LLMServing实现推理吞吐提升2倍多;升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。

为降低开发门槛,昇思持续升级MindSpore TransFormers大模型套件,并提供MindSpore One生成式套件,全流程开箱即用,一周即可完成大模型全流程的开发。

创新AI+科学计算范式,孵化科学领域基础大模型。MindSpore已在AI生物计算探索多年,联合顶级科研机构和伙伴打造了AI生物计算套件,包含蛋白质结构预测、生成等20多个SOTA模型,加速相关领域创新。

面向长远规划,昇思MindSpore将深耕根技术,持续演进,助力大模型产业落地。

此外,昇思MindSpore开源社区理事长丁诚在大会上公布了昇思赋能学术与生态的四项行动。昇思和中国人工智能学会、鹏城实验室合作的学术论文基金2.0,将在未来3年内携手50多家全球AI学者,探索学术新高峰,实现数量质量双提升;昇思开发板应用创新行动,基于香橙派开发板,提供系统化的案例、教程与支持,帮助开发者快速上手、快速入门、快速打造个性化应用;昇思加速原生大模型孵化,通过激励、专项技术支持和市场联合推广,支持更多伙伴从昇思迁移适配走向原生开发;昇思开源社区实习活动,通过代码实践,让开发者真正的实践成长。

编辑:孙冰

  • 人民日报社中国经济周刊官方网站
  • 中央新闻网站
  • 互联网新闻信息稿源单位
《中国经济周刊》杂志社有限公司
  • 经济网热线:010-65363451 65363495
  • 违法和不良信息举报电话:010-65363150
  • 经济网邮箱:jjw@ceweekly.cn
  • 违法和不良信息举报邮箱:jjw@ceweekly.cn