Flex:ai有何厉害之处 破解算力资源浪费难题(flexible intelligence)

AI产业的迅速发展催生了巨大的算力需求,但全球算力资源利用率低的问题日益突出。具体表现为小模型任务独占整张GPU或NPU导致资源闲置,大模型任务则因单机算力不足而难以运行,许多通用『服务器』由于缺乏GPU或NPU处于算力“休眠”状态,供需不匹配造成了资源浪费。

11月21日,在2025 AI容器应用落地与发展论坛上,华为公司副总裁、数据存储产品线总裁周跃峰发布了AI容器技术Flex:ai。该技术通过算力切分,将单张GPU或NPU切分为多个虚拟算力单元,最小切分粒度可达10%。这使得单卡可以同时承载多个AI工作负载,提高了算力资源平均利用率约30%。

面对先进制程受限及单颗AI『芯片』性能与国外存在差距的情况,Flex:ai延续了华为“以软件补硬件”的策略。这项新技术还将对标『英伟达』于2024年底收购的以色列公司Run:ai。Run:ai基于Kubernetes构建的软件平台,通过动态调度、池化和分片等手段优化GPU资源使用。例如,自动驾驶公司Wayve利用Run:ai将其GPU集群效率从不到25%提升到80%以上。华为的Flex:ai同样致力于通过软件创新实现对包括『英伟达』、昇腾在内的第三方算力进行统一管理和调度,屏蔽底层硬件差异,为AI应用提供更高效稳定的资源支持。

与主要服务于『英伟达』GPU生态的Run:ai不同,Flex:ai没有生态限制,支持『英伟达』GPU和华为昇腾NPU等多种算力卡。Flex:ai的能力已在实际场景中得到验证。瑞金医院与华为合作开发的多模态病理大模型“RuiPath”,用于识别19种常见癌症的病理切片病灶区域。该模型基于103万张病理切片训练而成,仅用16张昇腾910B算力卡就完成了大规模训练。背后的技术支撑来自Flex:ai,它通过算力资源切分和智能任务调度等技术,将XPU资源可用度从40%提高到了70%,解决了有限算力下的大规模训练问题。

IT研究与咨询公司Gartner的分析师指出,目前大多数AI负载已采用容器化部署和运行。预计到2027年,超过75%的AI工作负载将使用容器技术进行部署和运行。华为表示,Flex:ai将在发布后同步开源在魔擎社区,并与华为此前开源的多款AI工具共同构成完整的ModelEngine开源生态系统。

特别声明:[Flex:ai有何厉害之处 破解算力资源浪费难题(flexible intelligence)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

装都不装了,李咏美国下葬7年后,妻子哈文还是走上了姜昆的老路(装都不装了什么意思)

毕竟,她曾是春晚的总导演,掌管着全国最受关注的舞台,而现在却在美国享受圣诞节,许多人觉得这种做法不太合适。当时,她是该节目的『制片人』,也让丈夫李咏成为了家喻户晓的主持人。李咏曾在采访中表示,他和哈文都忙于工作,…

装都不装了,李咏美国下葬7年后,妻子哈文还是走上了姜昆的老路(装都不装了什么意思)

甜度超标!娜扎颁奖礼拎灯笼笑,碎钻裙藏不住温柔感

昨晚我在刷手机时,突然看到娜扎穿着那条粉色的裙子👗,胸口开到胃部,裙子👗上闪耀的碎钻亮得像小区的路灯集体失灵。 这条深V设计的粉色纱裙,和裙子👗上镶嵌的钻石都是高调的元素,但她却穿得像穿T恤👕一样轻松自在。说完,…

甜度超标!娜扎颁奖礼拎灯笼笑,碎钻裙藏不住温柔感

深圳中诺检测 重庆防爆电气检测(深圳中诺检测技术有限公司招聘信息)

重庆地区的综合运营成本可能具有一定优势,这使得重庆防爆电气检测在服务报价上可能更具竞争力,特别是对于预算敏感、主要面向国内市场的广大中小企业。 深圳中诺检测与重庆防爆电气检测,代表了在防爆安全这一专业领域内…

深圳中诺检测 重庆防爆电气检测(深圳中诺检测技术有限公司招聘信息)

氢氧化钠溶液介质配套橡胶补偿器应用研究(氢氧化钠溶液1→5)

在这种高要求的工况下,橡胶接头作为一种关键的配套装置,发挥着重要作用。在此背景下,针对不同管道和介质条件,上海淞江集团凭借其在管道连接设备领域的技术积累,能够提供针对性强、性能稳定的橡胶接头产品,满足各类复…

氢氧化钠溶液介质配套橡胶补偿器应用研究(氢氧化钠溶液1→5)

诺奖级技术融合人工智能,引领制药研发新浪潮(诺奖级别成果)

这一突破为靶点识别与药物设计提供了高精度结构基础,显著缩短了传统研发中依赖实验解析结构的时间。 当前AI制药仍面临数据质量、模型可解释性及临床转化成功率等挑战。随着多尺度模拟技术(如迈克尔·莱维特团队开发的分…

诺奖级技术融合人工智能,引领制药研发新浪潮(诺奖级别成果)