全网爆火的DeepSeek「UE8M0 FP8」,原来英伟达早已支持(deepsea )

全网爆火的<strong>DeepSeek</strong>「UE8M0 FP8」,原来<strong>英伟达</strong>早已支持(deepsea )

NVIDIA PTX ISA(并行线程执行,PTX 指令集)文档里面早就已经出现了 .ue8m0 这个数据类型

地址:

https://docs.nvidia.com/cuda/parallel-thread-execution/#mma-scaling-kind-type-valid-combination

UE8M0 fp8 并不是 DeepSeek 独创

至少从 PTX 8.0/9.0(对应 Hopper/Ada 架构 GPU)开始,NVIDIA 已经在 ISA 级别支持 .ue8m0

它就是 NVIDIA 官方 scale 数据格式之一,用在 FP8/FP4 混合精度量化的场景

NVIDIA Hopper 架构 (H100 系列)

H100 GPU(2022 年发布),面向数据中心和 AI 训练/推理,是 首个官方支持 FP8 (E4M3 / E5M2) 混合精度 的 GPU 架构,在 PTX 指令里引入了 .ue8m0 作为 scale data type。

NVIDIA Ada Lovelace 架构 (RTX 40 系列)

RTX 4090 / 4080 / 4070 等消费级显卡(2022 年底发布),面向游戏和 AI 推理。同样在底层指令集里继承了 .ue8m0、E4M3/E5M2 的支持。

也就是说技术上:UE8M0 已经在 NVIDIA 硬件生态存在

因此个人觉得DeepSeek 这句话应该这么理解

这相当于DeepSeek V3.1 把原本只在硬件/内核实现层面存在的 scale 表达方式,提升到模型部署和训练标准,适配了国产下一代芯片,但DeepSeek的确是在走别人没走过的路

特别声明:[全网爆火的DeepSeek「UE8M0 FP8」,原来英伟达早已支持(deepsea )] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

多孔平衡式流量计:抗扰稳计量,复杂工况适配强(多孔平衡式流量计 德国NOOK诺克)

多孔平衡式流量计作为工业计量领域应对复杂工况的专业设备,凭借抗干扰、计量稳的核心优势,正成为企业精准管控流量的重要选择。 在工业生产中,介质流动常受压力波动、杂质干扰、流速不均等因素影响,传统流量计难以稳定捕…

多孔平衡式流量计:抗扰稳计量,复杂工况适配强(多孔平衡式流量计 德国NOOK诺克)

称重灌装机,2升灌装机,喷墨墨水灌装机(称重灌装机视频)

灌装范围: 1-10L(L桶) 灌装速度: 120-360(桶h)在购买前必须了解设备的故障率、维修难易程度,是否有专业的技术服务团队提供售后服务。只有这些因素都被考虑到,才可以更好地保障企业生产效益及…

称重灌装机,2升灌装机,喷墨墨水灌装机(称重灌装机视频)

这位虚拟偶像何以成为“实力派”(虚拟偶像知乎)

在2024年跨年演唱会上,星璃与观众实时互动时展现的即兴舞蹈,其动作复杂度较传统虚拟偶像提升300%,背后是每秒45万亿次的云端算力支撑。在时尚领域,其与高定品牌合作的数字时装周,通过区块链技术实现服装NFT…

这位虚拟偶像何以成为“实力派”(虚拟偶像知乎)

Cash, Drones, and Vacuums: DJI, Insta360, and Dreame Open a New Front in China&#39;s Tech Wars

Its bet on drones is a natural extension. Patents show Insta360 hasbeen preparing since 2025, and the …

Cash, Drones, and Vacuums: DJI, Insta360, and Dreame Open a New Front in China&#39;s Tech Wars

破坏即创造,一场关于Supreme消费主义的街头艺术解构(提出破坏就是创造的是什么派)

Supreme官方对&quot;撕海报&quot;的现象始终保持着一种暧昧的默许,这种默许,本身就是最高明的营销策略,可以说是现代营销方式中&quot;四两拨千斤&quot;的典范,它彻底摒弃了传统广告投放逻

破坏即创造,一场关于Supreme消费主义的街头艺术解构(提出破坏就是创造的是什么派)