摩尔线程打造生产先进模型的“超级工厂”(摩尔线程薪资)

IT时报记者 孙妍

2025年7月25日,在世界人工智能大会(WAIC2025)开幕前夕,摩尔线程“AI工厂”成为国产『芯片』产业的焦点。

摩尔线程创始人兼CEO张建中在“算力进化,精度革命”技术分享会上表示,为应对生成式AI爆发式增长下的大模型训练效率瓶颈,摩尔线程通过系统级工程创新,构建新一代AI训练基础设施,为AGI时代打造生产先进模型的“超级工厂”。

今日霍州(www.jrhz.info)©️

“AI工厂”:AI训练向十万卡级规模演进

全球科技巨头正以惊人的速度迭代模型,从GPT系列、Gemini到『DeepSeek』、QWen的快速更新,模型训练迭代时间已缩短至不足3个月,这种高频迭代不仅体现在大型语言模型(LLM)上,还同步扩展至多模态模型、语音模型、世界模型等前沿模型领域。这些模型在性能、效率和应用场景上实现的指数级突破,不仅推动了AI从专用领域向通用智能的跨越,其快速迭代的特性更对新一代高性能人工智能计算基础设施提出了迫切需求。

摩尔线程提出的“AI工厂”,如同『芯片』晶圆厂的制程升级,是一个系统性、全方位的变革,需要实现从底层『芯片』架构创新、到集群整体架构的优化,再到软件算法调优和资源调度系统的全面升级。这种全方位的基础设施变革,将推动AI训练从千卡级向万卡级乃至十万卡级规模演进,以系统级工程实现生产力和创新效率的飞跃。

这座“AI工厂”的智能“产能”,由五大核心要素共同决定,其效率公式可概括为:AI工厂生产效率 = 加速计算通用性 × 单『芯片』有效算力 × 单节点效率 × 集群效率 × 集群稳定性。

摩尔线程以全功能GPU通用算力为基石,通过先进架构、『芯片』算力、单节点效率、集群效率优化与可靠性等协同跃升的深度技术创新,将全功能GPU加速计算平台的强大潜能,转化为工程级的训练效率与可靠性保障。

五大核心技术:系统性提升AI训练效率

摩尔线程通过软硬深度协同的系统级创新,从五大核心技术构建“AI工厂”,致力于推动大模型训练效率实现质的飞跃。

今日霍州(www.jrhz.info)©️

在AI基础设施建设中,计算功能的完备性与精度完整性是支撑多元场景的核心基石。摩尔线程以自主研发的全功能GPU为核心,构建了“功能完备”与“精度完整”的通用性底座,全面覆盖从AI训练、推理到科学计算的全场景需求。

基于MUSA架构的突破性设计,摩尔线程的GPU单『芯片』即可集成AI计算加速、图形渲染、物理仿真及超高清视频编解码能力,充分适配AI训推、具身智能、AIGC等多样化应用场景。在计算精度方面,摩尔线程支持从FP64至INT8的完整精度谱系,并通过FP8混合精度技术,在主流前沿大模型训练中实现20%~30%的性能跃升。这一技术体系不仅满足大模型时代的高效计算需求,更为世界模型和新兴AI架构的演化提供前瞻性支撑,助力AI基础设施向高通用性、高精度方向持续升级。

今日霍州(www.jrhz.info)©️

『芯片』的有效算力是驱动“AI工厂”高效运转的核心动力。摩尔线程基于自研MUSA架构,通过计算、内存、通信三重突破,显著提升单GPU运算效率。

摩尔线程采用创新的多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建了全局共享的计算、内存与通信资源池。这一设计不仅突破了传统GPU功能单一的限制,还在保障通用性的同时显著提升了资源利用率。其参数化配置可伸缩架构允许面向目标市场快速裁剪出优化的『芯片』配置,大幅降低了新品『芯片』的开发成本。

在计算层面,摩尔线程的AI加速系统支持INT8/FP8/FP16/BF16/TF32等多种混合精度计算。作为国内首批实现FP8算力量产的GPU厂商,其FP8技术通过快速格式转换、动态范围智能适配和高精度累加器等创新设计,在保证计算精度的同时,将Transformer计算性能提升约30%。

内存系统方面,通过多精度近存规约引擎、低延迟Scale-Up、通算并行资源隔离等技术,实现了50%的带宽节省和60%的延迟降低。在通信和互联领域,独创的ACE异步通信引擎减少了15%的计算资源损耗,MTLink2.0互联技术提供了高出国内行业平均水平60%的带宽,为大规模集群部署奠定了坚实基础。

当AI算力竞争进入深水区,摩尔线程通过MUSA全栈系统软件实现关键技术突破,推动AI工厂从单点创新转向系统级效能提升,实现『DeepSeek』 R1推理加速1.5倍,全面兼容Triton等主流框架。

当单节点效率达到新高度,如何实现大规模集群的高效协作成为新的挑战。摩尔线程自研KUAE计算集群通过5D大规模分布式并行计算技术,实现上千节点的高效协作,推动AI基础设施从单点优化迈向系统工程级突破。

所谓“5D”,就是整合数据、模型、张量、流水线和专家并行技术,全面支持Transformer等主流架构,显著提升大规模集群训练效率。

精准模拟FP8混合精度训练与算子融合,为『DeepSeek』等模型缩短训练周期提供科学依据。针对大模型稳定性难题,将百GB级备份恢复时间从数分钟压缩至1秒,实现秒级备份恢复,提升GPU有效算力利用率。

在构建高效集群的基础上,稳定可靠的运行环境是“AI工厂”持续产出的保障。特别在万卡级AI集群中,硬件故障导致的训练中断会严重浪费算力。摩尔线程创新推出零中断容错技术,故障发生时仅隔离受影响节点组,其余节点继续训练,备机无缝接入,全程无中断。这一方案使KUAE集群有效训练时间占比超99%,大幅降低恢复开销。

摩尔线程凭借全功能GPU的通用计算能力、创新的MUSA架构、优化的MUSA软件栈、自研的KUAE集群以及零中断容错技术这五大核心要素,构建起高效的“AI工厂”。

AI工厂,驱动千行百业智能升级

完善的“AI工厂”不仅需要高效训练大模型,还需具备推理验证能力。摩尔线程基于自研MUSA技术栈,构建覆盖LLM、视觉、生成类模型的全流程推理解决方案,实现“训练-验证-部署”的无缝衔接。

这一突破标志着国产计算基础设施已具备支撑AGI时代规模化、高效率、高可靠模型生产的关键能力。

从图形渲染基石到AI算力引擎,摩尔线程全功能GPU持续加速计算革新。以“KUAE+MUSA”为智算业务核心,摩尔线程将加速赋能千行百业,推动全功能GPU驱动的AI技术在物理仿真、AIGC、科学计算、具身智能、智能体、医疗影像分析、工业大模型等关键领域的应用与部署。

开放是生态繁荣之源,摩尔线程将于今年10月举办首届MUSA开发者大会,邀请全球开发者共探前沿技术,共享MUSA自主新生态。

特别声明:[摩尔线程打造生产先进模型的“超级工厂”(摩尔线程薪资)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

顶级骑行眼镜👓生产厂家,支持一件代发的优质选择(性价比高的骑行眼镜👓)

市场上有多家知名生产厂家,如某某厂家和某某品牌,它们在工艺、材料方面都有良好口碑,是值得推荐的选择。 一件代发服务为骑行眼镜👓业务带来的优势与方便 在骑行眼镜👓市场中,一件代发服务为商家提供了不少便利。优质厂家…

顶级骑行眼镜👓生产厂家,支持一件代发的优质选择(性价比高的骑行眼镜👓)

侯明昊上海亮相潮范十足,喊话粉丝勇敢一些多多见面(侯明昊在上海有房子吗)

当天他穿的是品牌2026早春系列,拼色设计加上宽松廓形,看着随性又有层次感,他自己也特意安利,说这件衣服版型好、有设计感,日常出门穿都很合适。他还说私下里偏爱休闲风,喜欢简单但有小设计的衣服,不刻意凹造型,…

侯明昊上海亮相潮范十足,喊话粉丝勇敢一些多多见面(侯明昊在上海有房子吗)

纪实王心刚:高龄92岁与病妻白头偕老,儿女傍膝很幸福(王心刚简历)

在战火纷飞的岁月里,母亲依然坚守着自己的爱好,这份坚韧不拔的精神,深深影响了王心刚。在一次家庭对话中,他告诉父亲自己想要学戏剧,想要成为一名演员,父亲的怒火随之而来:我们家几代都没有出过戏子,你若去学戏,我就…

纪实王心刚:高龄92岁与病妻白头偕老,儿女傍膝很幸福(王心刚简历)

日本强降雪已致17人死亡 多地交通严重受阻(日本多地连降大雪)

日本多地近日遭遇强降雪。截至1月31日8时30分,本轮强降雪已在全国范围内造成17人死亡、249人受伤。大雪严重影响了交通,部分列车停运、航班取消,数十万人的出行受到影响

日本强降雪已致17人死亡 多地交通严重受阻(日本多地连降大雪)

硅谷一AI网站首次租用人类 AI雇佣人类成现实(《硅谷》)

在人工智能技术快速发展的今天,硅谷迎来了一场前所未有的“反转”。一项名为“RentAHuman.ai”的新兴平台近日在『互联网』上引发轰动,标志着“AI雇佣人类”这一概念不再是科幻小说的情节,而是正在进行的现实实验

硅谷一AI网站首次租用人类 AI雇佣人类成现实(《<strong>硅谷</strong>》)