12月18日,火山引擎在2025冬季Force原动力大会上正式发布豆包大模型1.8及音视频创作模型Seedance 1.5 pro,凭借在多模态理解、生成及Agent能力上的突破性进展,标志着我国AI大模型技术跻身全球前列,为千行百业的智能化转型注入新动能。

作为面向多模态Agent场景优化的旗舰模型,豆包大模型1.8实现了核心能力的全面升级。在Agent能力方面,其工具调用、复杂指令遵循及OS Agent能力显著增强,在通用智能体测评集BrowseComp中取得全球领先成绩;视觉理解领域,单次视频理解帧数从640帧倍增至1280帧,支持低帧率解析超长视频,在空间理解、文档结构化解析等多项任务中表现超越国际同类模型。截至今年12月,豆包大模型日均token使用量突破50万亿,较去年同期增长超10倍,已有超100家企业客户累计token使用量超万亿,彰显出技术落地的强劲活力。

针对音视频创作领域的痛点需求,Seedance 1.5 pro构建原生音视频联合生成架构,实现毫秒级音画同步,支持多人多语言及中文方言对话的精准口型对齐,具备电影级运镜控制与叙事协调性。即将上线的“Draft样片”功能,可通过低分辨率预览实现“预览即所得”,帮助创作者提升65%的工作效率,减少60%无效创作成本,目前个人用户已可在豆包、即梦AI等平台体验,企业用户将于12月23日通过API接入服务。
为推动AI技术规模化落地,火山引擎同步升级AI云原生基础设施:企业级AI Agent平台AgentKit覆盖智能体开发、部署、管控全生命周期;HiAgent智能体工作站通过“1+N+X”体系实现规模化管理与个性化定制;业内首个“AI节省计划”以阶梯式折扣最高为企业节省47%成本。目前,火山引擎大模型服务已覆盖100多个行业,全球Top10手机厂商中9家、超8成系统重要性银行、9成主流车企及超7成985高校均已合作,中国公有云大模型服务调用量稳居第一,市场份额达49.2%。
从智能座舱的语音交互到金融行业的智能投顾,从高校科研的辅助工具到消费场景的服务升级,火山引擎的AI技术正深度融入实体经济各领域。火山引擎总裁谭待表示,将持续通过模型能力与基础设施的双重革新,推动AI应用从单一模型调用向复杂Agent生态演进,为我国数字经济高质量发展提供坚实支撑。(英皓)