计算机:华为发布AI容器技术Flex:ai,国产算力再次突破

股票资讯 阅读:3 2025-11-24 14:13:40 评论:0

  直面算力利用效率低下难题,华为发布AI容器技术Flex:ai

  11月21日下午,华为在上海举办“2025AI容器应用落地与发展论坛”,会上正式发布并开源了创新AI容器技术Flex:ai。目前,行业内算力资源的平均利用率仅为30%至40%,据华为介绍,华为Flex:ai是基于Kubernetes容器编排平台构建的XPU池化与调度软件,通过算力切分技术,将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10%。此技术实现了单卡同时承载多个AI工作负载,在无法充分利用整卡算力的AI工作负载场景下,算力资源平均利用率可提升30%。

  AI时代需要AI容器技术,华为Flex.ai对标英伟达Run:ai具有独特优势

  传统容器技术难以适配AI工作负载需求,AI容器作为轻量级虚拟化技术,可打包模型代码与运行环境实现跨平台迁移,解决环境配置不一致问题,且能按需挂载GPU/NPU算力、优化集群资源利用率。Gartner表示,目前AI负载大多都已容器化部署和运行,据预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行。

  与英伟达今年年初收购的Run:ai公司的核心产品相比,华为Flex:ai在虚拟化、智能调度等方面具备独特优势。具体来看,在本地虚拟化技术中,Flex:ai支持把单个物理GPU/NPU算力卡切割为数个虚拟算力单元,并通过弹性灵活的资源隔离技术,可实现算力单元的按需切分。智能调度方面,Flex:ai智能资源和任务调度技术,可自动感知集群负载与资源状态,结合AI工作负载的优先级、算力需求等多维参数,对本地及远端的虚拟化GPU、NPU资源进行全局最优调度,满足不同AI工作负载对资源的需求。

  以软件补硬件提升AI训推效率,国产AI生态发展再进阶

  Flex:ai秉承开源与兼容异构算力的理念,进一步强化国产算力实力。Flex:ai将在发布后开源在魔擎社区中,与华为此前开源的Nexent智能体框架、AppEngine应用编排、DataMate数据工程、UCM推理记忆数据管理器等AI工具共同组成了完整的ModelEngine开源生态。另外,与英伟达旗下Run:ai只能绑定英伟达算力卡不同,Flex:ai通过软件创新,可实现对英伟达、昇腾及其他第三方算力资源的统一管理和高效利用,有效屏蔽不同算力硬件之间的差异,为AI训练推理提供更高效的资源支持。

  建议关注

  我们认为,华为推出的Flex:ai核心围绕“XPU池化+算力细粒度切分+全局智能调度”三大支柱,通过对GPU/NPU等异构智算资源的容器化管控、跨节点聚合与弹性分配,致力于大幅提升AI集群的算力利用效率、降低生态迁移门槛、加速模型训练与推理的落地进程;其秉持“开源兼容+跨生态适配”的核心定位,进一步强化了国产算力软件层的统一调度能力,构成了“以软件能力补齐硬件短板”的确定性突破。建议关注:1)AI容器:博睿数据、浩瀚深度、普元信息、青云科技、实达集团、首都在线、中亦科技、南威软件、浪潮数字企业;2)国产算力:寒武纪、云天励飞、亿都(国际控股)、浪潮信息、曙光数创、超讯通信、瑞晟智能、华丰科技、神州数码、软通动力、烽火通信、广电运通、拓维信息、四川长虹、润建股份、数据港、润泽科技、光环新网、科华数据、奥飞数据、优刻得、立讯精密、安博通等。

  风险提示:

  技术发展不及预期、政策落地不及预期、行业竞争加剧等。


中邮证券 陈涵泊,李佩京,王思
声明

本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。