今天分享的是:产业深度:【AI产业深度】华为盘古大模型与昇腾AI计算平台,共同构建软硬一体的AI技术体系
报告共计:27页
华为正通过盘古大模型与昇腾AI计算平台的协同,构建软硬一体的全栈AI技术体系,其AI发展策略已从追赶对标业界SOTA模型,转向为发挥自研昇腾硬件潜力量身定制模型架构。
盘古大模型的演进体现了这一思路。从2025年发布的PanGu-α确立基于昇腾与自研框架的技术路线,到2023年PanGu-Σ尝试稀疏化并向万亿参数探索,再到盘古3.0提出“5+N+X”架构面向多行业落地,直至盘古5.5全面拥抱MoE架构,其核心是与昇腾硬件协同优化。
为最大化昇腾硬件利用效率,华为推出Pangu Pro MoE与Pangu Ultra MoE。Pangu Pro MoE提出分组专家混合(MoGE)架构,通过专家分组和组内均衡路由解决传统MoE的负载不均衡问题,并针对昇腾平台在训练和推理阶段进行深度定制90🔷102🔶。Pangu Ultra MoE则采用仿真先行的设计方法,结合定制训练策略和系统级优化,在昇腾集群上实现了较高的模型算力利用率🔶1-129🔶131🔶146🔶171🔶。
新一代AI基础设施CloudMatrix为软硬协同提供物理基础。其核心技术统一总线(UB)网络构建分布式高速内存池,降低跨节点通信性能差异。CloudMatrix-Infer采用PDC分离架构、大规模专家并行(LEP)和AIV-Direct通信机制等,提升了推理效率,能高效承载包括第三方模型在内的各类大模型任务🔶1-5🔶180🔶195🔶211🔶218🔶。
华为的全栈协同还体现在开源策略上,通过开源盘古系列模型和CANN软件栈,吸引开发者进入昇腾生态,推动硬件应用和生态建设🔶1-300🔶302🔶303🔶。这种架构、系统和算子层面的全栈协同,构成了华为AI的核心竞争力,旨在为B端行业客户提供稳定、安全的端到端解决方案🔶1-314🔶322🔶。
以下为报告节选内容