产业深度：【AI产业深度】华为盘古大模型与昇腾AI计算平台，共同构建软硬(产业高度) #科技 #策略 #架构 #盘古 #硬件 #华为

今天分享的是：产业深度：【AI产业深度】华为盘古大模型与昇腾AI计算平台，共同构建软硬一体的AI技术体系

报告共计：27页

华为正通过盘古大模型与昇腾AI计算平台的协同，构建软硬一体的全栈AI技术体系，其AI发展策略已从追赶对标业界SOTA模型，转向为发挥自研昇腾硬件潜力量身定制模型架构。

盘古大模型的演进体现了这一思路。从2025年发布的PanGu-α确立基于昇腾与自研框架的技术路线，到2023年PanGu-Σ尝试稀疏化并向万亿参数探索，再到盘古3.0提出“5+N+X”架构面向多行业落地，直至盘古5.5全面拥抱MoE架构，其核心是与昇腾硬件协同优化。

为最大化昇腾硬件利用效率，华为推出Pangu Pro MoE与Pangu Ultra MoE。Pangu Pro MoE提出分组专家混合（MoGE）架构，通过专家分组和组内均衡路由解决传统MoE的负载不均衡问题，并针对昇腾平台在训练和推理阶段进行深度定制90🔷102🔶。Pangu Ultra MoE则采用仿真先行的设计方法，结合定制训练策略和系统级优化，在昇腾集群上实现了较高的模型算力利用率🔶1-129🔶131🔶146🔶171🔶。

新一代AI基础设施CloudMatrix为软硬协同提供物理基础。其核心技术统一总线（UB）网络构建分布式高速内存池，降低跨节点通信性能差异。CloudMatrix-Infer采用PDC分离架构、大规模专家并行（LEP）和AIV-Direct通信机制等，提升了推理效率，能高效承载包括第三方模型在内的各类大模型任务🔶1-5🔶180🔶195🔶211🔶218🔶。

华为的全栈协同还体现在开源策略上，通过开源盘古系列模型和CANN软件栈，吸引开发者进入昇腾生态，推动硬件应用和生态建设🔶1-300🔶302🔶303🔶。这种架构、系统和算子层面的全栈协同，构成了华为AI的核心竞争力，旨在为B端行业客户提供稳定、安全的端到端解决方案🔶1-314🔶322🔶。

以下为报告节选内容