云天励飞DeepEdge10适配『DeepSeek』开源周“首个大招”:FlashMLA

云天励飞DeepEdge10适配『DeepSeek』开源周“首个大招”:FlashMLA

2月24日,『DeepSeek』"开源周"正式启动,并发布首个代码库FlashMLA,引发全球关注。

FlashMLA是针对『英伟达』Hopper GPU优化的高效MLA解码内核,专为可变长度序列优化设计,是『DeepSeek』高效使用算力的核心程序模块。FlashMLA通过MLA解码优化与分页KV缓存技术,显著提升硬件利用率,加速『大语言模型』解码过程,有效提高响应速度与吞吐量,适用于各种实时对话生成场景。

云天励飞『芯片』团队在FlashMLA开源后,迅速完成了DeepEdge10平台与FlashMLA的适配工作。在适配过程中,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先进技术,并基于自研的Triton-like编程语言快速开发验证了高效的FlashMLA算子。通过一系列优化,不仅显著提升了计算效率,还大幅降低了显存占用,充分展现了DeepEdge10平台“算力积木”『芯片』架构的卓越优势,以及其与『DeepSeek』生态的高度契合性。

今日,云天励飞已将相关代码提交至开源平台Gitee,为开源AI贡献了重要的技术力量。

DeepEdge10系列『芯片』是专门针对大模型时代打造的『芯片』,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、『机器人』️、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。

目前,DeepEdge10『芯片』平台已成功适配『DeepSeek』 R1系列模型及国产鸿蒙操作系统。未来,云天励飞将持续加大研发力度,推动『芯片』在国产化领域取得更大突破,为国产AI生态建设贡献更多力量。

特别声明:[云天励飞DeepEdge10适配『DeepSeek』开源周“首个大招”:FlashMLA] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

太震撼了!灾难悬疑剧!废墟中盼望生机!全员老戏骨!太真实!(灾难混剪震撼视频)

而当十三人被困地下后,人性中的光明与黑暗被无限放大,他们的选择、挣扎与牺牲,都将成为我们反思人性、审视自我的一面镜子。 在灾难面前,人类的脆弱与求生欲望是相通的,而正是这份共通,让我们看到了人性中最坚韧、最…

太震撼了!灾难悬疑剧!废墟中盼望生机!全员老戏骨!太真实!(灾难混剪震撼视频)

四大平台甩出了“热门剧”擂台比拼,使出看家本领,谁能拔得头筹(4大平台)

该剧讲述了住在一条小巷里的三个家庭,有庄家、林家、吴家,几家人在时代的变迁里的变化,小巷里的家长里短,随着环境的发展各奔东西,从小青梅竹马的情谊,即使天南地北也总能相聚,这条沧桑又温暖小巷充满了人情味儿和烟…

四大平台甩出了“热门剧”擂台比拼,使出看家本领,谁能拔得头筹(4大平台)

老电影《沙漠里的战斗》拍摄记忆(老电影《沙漠突击队》完整视频)

这部由"战争片圣手"汤晓丹掌镜的杰作,把镜头对准了天山以北的无人区,用胶片镌刻下解放军征服戈壁的壮丽史诗。当银幕上掀起沙暴时,观众甚至会下意识揉眼睛——那些打在演员脸上的沙粒,可都是货真价实的&q

老电影《<strong>沙漠里的战斗</strong>》拍摄记忆(老电影《<strong>沙漠突击队</strong>》完整视频)

49岁『舒淇』传来喜讯,一个不常在家的女人,却成了冯德伦的掌上明珠(『舒淇』转型前)

如今站在事业与爱情双丰收的人生巅峰,谁又能想到这位国际影星曾经历过怎样的坎坷与挣扎。在最黑暗的日子里,『舒淇』几乎失去所有工作机会。从被嫌弃的1&quot;艳星1&quot;到备受尊敬的影后,从爱情里的卑微者到事业家庭双丰收的赢

49岁『舒淇』传来喜讯,一个不常在家的女人,却成了冯德伦的掌上明珠(『舒淇』转型前)

多玛、盖泽、GMT定制门控系统怎么选?客服必问这5点!(多玛位置)

高端自动门控系统定制选多玛、盖泽还是GMT?价格差在哪?技术支持如何?本文梳理三大品牌核心差异,教你通过客服沟通锁定最适合的解决方案,避坑省预算。 别再盲目下单,先看这篇再联系客服!

多玛、盖泽、GMT定制门控系统怎么选?客服必问这5点!(多玛位置)