摩尔线程打造生产先进模型的“超级工厂”(摩尔线程薪资)

摩尔线程打造生产先进模型的“超级工厂”(摩尔线程薪资)

IT时报记者 孙妍

2025年7月25日,在世界人工智能大会(WAIC2025)开幕前夕,摩尔线程“AI工厂”成为国产『芯片』产业的焦点。

摩尔线程创始人兼CEO张建中在“算力进化,精度革命”技术分享会上表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程通过系统级工程创新,构建新一代AI训练基础设施,为AGI时代打造生产先进模型的“超级工厂”。

“AI工厂”:AI训练向十万卡级规模演进

全球科技巨头正以惊人的速度迭代模型,从GPT系列、Gemini到『DeepSeek』、QWen的快速更新,模型训练迭代时间已缩短至不足3个月,这种高频迭代不仅体现在大型语言模型(LLM)上,还同步扩展至多模态模型、语音模型、世界模型等前沿模型领域。这些模型在性能、效率和应用场景上实现的指数级突破,不仅推动了AI从专用领域向通用智能的跨越,其快速迭代的特性更对新一代高性能人工智能计算基础设施提出了迫切需求。

摩尔线程提出的“AI工厂”,如同『芯片』晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层『芯片』架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。

这座“AI工厂”的智能“产能”,由五大核心要素共同决定,其效率公式可概括为:AI工厂生产效率 = 加速计算通用性 × 单『芯片』有效算力 × 单节点效率 × 集群效率 × 集群稳定性。

摩尔线程以全功能GPU通用算力为基石,通过先进架构、『芯片』算力、单节点效率、集群效率优化与可靠性等协同跃升的深度技术创新,将全功能GPU加速计算平台的强大潜能,转化为工程级的训练效率与可靠性保障。

五大核心技术:系统性提升AI训练效率

摩尔线程通过软硬深度协同的系统级创新,从五大核心技术构建“AI工厂”,致力于推动大模型训练效率实现质的飞跃。

在AI基础设施建设中,计算功能的完备性与精度完整性是支撑多元场景的核心基石。摩尔线程以自主研发的全功能GPU为核心,构建了“功能完备”与“精度完整”的通用性底座,全面覆盖从AI训练、推理到科学计算的全场景需求。

基于MUSA架构的突破性设计,摩尔线程的GPU单『芯片』即可集成AI计算加速、图形渲染、物理仿真及超高清视频编解码能力,充分适配AI训推、具身智能、AIGC等多样化应用场景。在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升。这一技术体系不仅满足大模型时代的高效计算需求,更为世界模型和新兴AI架构的演化提供前瞻性支撑,助力AI基础设施向高通用性、高精度方向持续升级。

『芯片』的有效算力是驱动“AI工厂”高效运转的核心动力。摩尔线程基于自研MUSA架构,通过计算、内存、通信三重突破,显著提升单GPU运算效率。

摩尔线程采用创新的多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建了全局共享的计算、内存与通信资源池。这一设计不仅突破了传统GPU功能单一的限制,还在保障通用性的同时显著提升了资源利用率。其参数化配置可伸缩架构允许面向目标市场快速裁剪出优化的『芯片』配置,大幅降低了新品『芯片』的开发成本。

在计算层面,摩尔线程的AI加速系统支持INT8/FP8/FP16/BF16/TF32等多种混合精度计算。作为国内首批实现FP8算力量产的GPU厂商,其FP8技术通过快速格式转换、动态范围智能适配和高精度累加器等创新设计,在保证计算精度的同时,将Transformer计算性能提升约30%。

内存系统方面,通过多精度近存规约引擎、低延迟Scale-Up、通算并行资源隔离等技术,实现了50%的带宽节省和60%的延迟降低。在通信和互联领域,独创的ACE异步通信引擎减少了15%的计算资源损耗,MTLink2.0互联技术提供了高出国内行业平均水平60%的带宽,为大规模集群部署奠定了坚实基础。

当AI算力竞争进入深水区,摩尔线程通过MUSA全栈系统软件实现关键技术突破,推动AI工厂从单点创新转向系统级效能提升,实现『DeepSeek』 R1推理加速1.5倍,全面兼容Triton等主流框架。

当单节点效率达到新高度,如何实现大规模集群的高效协作成为新的挑战。摩尔线程自研KUAE计算集群通过5D大规模分布式并行计算技术,实现上千节点的高效协作,推动AI基础设施从单点优化迈向系统工程级突破。

所谓“5D”,就是整合数据、模型、张量、流水线和专家并行技术,全面支持Transformer等主流架构,显著提升大规模集群训练效率。

精准模拟FP8混合精度训练与算子融合,为『DeepSeek』等模型缩短训练周期提供科学依据。针对大模型稳定性难题,将百GB级备份恢复时间从数分钟压缩至1秒,实现秒级备份恢复,提升GPU有效算力利用率。

在构建高效集群的基础上,稳定可靠的运行环境是“AI工厂”持续产出的保障。特别在万卡级AI集群中,硬件故障导致的训练中断会严重浪费算力。摩尔线程创新推出零中断容错技术,故障发生时仅隔离受影响节点组,其余节点继续训练,备机无缝接入,全程无中断。这一方案使KUAE集群有效训练时间占比超99%,大幅降低恢复开销。

摩尔线程凭借全功能GPU的通用计算能力、创新的MUSA架构、优化的MUSA软件栈、自研的KUAE集群以及零中断容错技术这五大核心要素,构建起高效的“AI工厂”。

AI工厂,驱动千行百业智能升级

完善的“AI工厂”不仅需要高效训练大模型,还需具备推理验证能力。摩尔线程基于自研MUSA技术栈,构建覆盖LLM、视觉、生成类模型的全流程推理解决方案,实现“训练-验证-部署”的无缝衔接。

这一突破标志着国产计算基础设施已具备支撑AGI时代规模化、高效率、高可靠模型生产的关键能力。

从图形渲染基石到AI算力引擎,摩尔线程全功能GPU持续加速计算革新。以“KUAE+MUSA”为智算业务核心,摩尔线程将加速赋能千行百业,推动全功能GPU驱动的AI技术在物理仿真、AIGC、科学计算、具身智能、智能体、医疗影像分析、工业大模型等关键领域的应用与部署。

开放是生态繁荣之源,摩尔线程将于今年10月举办首届MUSA开发者大会,邀请全球开发者共探前沿技术,共享MUSA自主新生态。

特别声明:[摩尔线程打造生产先进模型的“超级工厂”(摩尔线程薪资)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

“能源与文明——科学艺术·聚变未来” 展览亮相中央美术学院美术馆

2025年9月14日,由中央美术学院、合肥综合性国家科学中心能源研究院与合肥市人民政府联合推出的大型科普展览“能源与文明——科学艺术·聚变未来”在中央美术学院美术馆隆重开幕。 此次展览列入2025年全国科普…

“能源与文明——科学艺术·聚变未来” 展览亮相中央美术学院美术馆

迪阿股份获得外观设计专利授权:“吊坠(DRHEART系列套链TL0382)”(迪阿股份 ipo)

证券之星消息,根据『天眼查APP』数据显示迪阿股份(301177)新获得一项外观设计专利授权,专利名为“吊坠(DRHEART系列套链TL0382)”,专利申请号为CN202430762949.X,授权日为2025…

迪阿股份获得外观设计专利授权:“吊坠(DRHEART系列套链TL0382)”(迪阿股份 ipo)

配角的脸,女主的命,不是科班出身却坐拥顶级资源,她有啥来头?(配角lryan)

周依然所展现出的优秀演技和与众不同的角色形象,让她在『娱乐圈』️中迅速崭露头角,备受瞩目。 周依然凭借多部影视作品中的精湛表现以及与实力演员的合作,逐渐积累了丰富的经验和人气,赢得了更多的资源和支持,为她的演艺事…

配角的脸,女主的命,不是科班出身却坐拥顶级资源,她有啥来头?(配角lryan)

看了62岁何赛飞和60岁刘嘉玲同框,才懂健身与不健身的区别(何赛飞多少岁)

与她相伴的是一众新面孔:60岁的时尚icon刘嘉玲、62岁的越剧名家何赛飞、53岁的率性女神宁静、45岁的港风美人『张柏芝』,以及25岁的柯淳和21岁的邵子恒两位年轻力量。 节目组此次的嘉宾组合可谓匠心独运:刘嘉…

看了62岁何赛飞和60岁刘嘉玲同框,才懂健身与不健身的区别(何赛飞多少岁)

孙浩:26岁上春晚走红,得罪杨坤20年不说话,55岁至今未婚没孩子(孙浩锎的年龄)

但谁能想到,这位如今被夸"演技封神"的戏骨,早年拍《天皇巨星》时还觉得"演戏就是份工钱"。 非常戏剧性的是当年在夜总会当音乐总监时,他大笔一挥划掉了个新人——后来这首歌

孙浩:26岁上春晚走红,得罪杨坤20年不说话,55岁至今未婚没孩子(孙浩锎的年龄)