云天励飞DeepEdge10适配DeepSeek开源周“首个大招”:FlashMLA

云天励飞DeepEdge10适配DeepSeek开源周“首个大招”:FlashMLA

2月24日,DeepSeek"开源周"正式启动,并发布首个代码库FlashMLA,引发全球关注。

FlashMLA是针对英伟达Hopper GPU优化的高效MLA解码内核,专为可变长度序列优化设计,是DeepSeek高效使用算力的核心程序模块。FlashMLA通过MLA解码优化与分页KV缓存技术,显著提升硬件利用率,加速大语言模型解码过程,有效提高响应速度与吞吐量,适用于各种实时对话生成场景。

云天励飞芯片团队在FlashMLA开源后,迅速完成了DeepEdge10平台与FlashMLA的适配工作。在适配过程中,云天励飞采用了Op fusion tiling、Online softmax、Double buffer、细粒度存算并行等先进技术,并基于自研的Triton-like编程语言快速开发验证了高效的FlashMLA算子。通过一系列优化,不仅显著提升了计算效率,还大幅降低了显存占用,充分展现了DeepEdge10平台“算力积木”芯片架构的卓越优势,以及其与DeepSeek生态的高度契合性。

今日,云天励飞已将相关代码提交至开源平台Gitee,为开源AI贡献了重要的技术力量。

DeepEdge10系列芯片是专门针对大模型时代打造的芯片,支持包括 Transformer 模型、BEV 模型、CV 大模型、LLM 大模型等各类不同架构的主流模型;基于自主可控的先进国产工艺打造,采用独特的“算力积木”架构,可灵活满足智慧城市、智慧交通、智能制造、智慧仓储、机器人、边缘智算中心等不同场景对算力的需求,为大模型推理提供强大动力。

目前,DeepEdge10芯片平台已成功适配DeepSeek R1系列模型及国产鸿蒙操作系统。未来,云天励飞将持续加大研发力度,推动芯片在国产化领域取得更大突破,为国产AI生态建设贡献更多力量。

特别声明:[云天励飞DeepEdge10适配DeepSeek开源周“首个大招”:FlashMLA] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

EXO成员CHANYEOL将于8月31日举行Solo出道一周年纪念演出“Sound Stage”!(exo成员变动情况)

搜狐韩娱讯 EXO成员CHANYEOL将通过一场特别演出,与粉丝们一同庆祝Solo出道一周年。 “CHANYEOL [Upside Down: Sound Stage]”将于8月31日在韩国首尔广津区YE…

EXO成员CHANYEOL将于8月31日举行Solo出道一周年纪念演出“Sound Stage”!(exo成员变动情况)

Soul App《2025生态安全半年报》:AI赋能安全,共创美好社交(生态板)

,在享受其带来巨大便利的同时,社交平台也面临着日益严峻的挑战,如网络诈骗、低俗内容泛滥、网络暴力侵扰等问题层出不穷,对用户体验和社会秩序构成了潜在威胁。这些数据充分表明,Soul App不仅在技术层面筑牢了…

Soul App《2025生态安全半年报》:AI赋能安全,共创美好社交(生态板)

郭晶晶终于摊牌不“装”了?新身份引人沸腾,揭开隐藏许久的真相(郭晶晶成功)

也正是这一句话让网络上的那些质疑声音完全消失,能得到这么好的认可,其实也是郭晶晶自己优秀赢得的。 但是别看她对自己,对家里人节省,对于公益事业方面的事情,郭晶晶从来没有节省过,老公霍启刚对于这样的郭晶晶也是…

郭晶晶终于摊牌不“装”了?新身份引人沸腾,揭开隐藏许久的真相(郭晶晶成功)

第二十届中国长春电影节征片收官!93部影片角逐“金鹿奖”

第二十届中国长春电影节影片征集工作于2025年7月1日正式启动,已于8月1日截止,征片周期为30天。 此外,本届电影节的申报影片涵盖国内多家知名单位,中影集团、长影集团、博纳影业、英皇影业、北京文化、爱奇艺影…

第二十届中国长春电影节征片收官!93部影片角逐“金鹿奖”

英伟达拒绝认罪,美国开始报复,拘留两名中国公民,恐重判20年(英伟达显卡显示拒绝访问)

联想到此前美国也曾以“间谍罪”拘捕中国公民,这种将对方公民当作筹码的“人质施压”策略,其意图昭然若揭,只要我们在芯片领域有任何不符其意的动作,他们就有能力用这种方式让你付出代价。 而对于这种以法律为幌子的“…

英伟达拒绝认罪,美国开始报复,拘留两名中国公民,恐重判20年(英伟达显卡显示拒绝访问)