『DeepSeek』发布最新技术论文!梁文锋参与署名

2月18日,『DeepSeek』在海外『社交平台』发布了一篇纯技术论文报告,论文主要内容是关于NSA(Natively Sparse Attention,原生稀疏注意力)。据介绍,这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

2月18日,『DeepSeek』在海外『社交平台』发布了一篇纯技术论文报告,论文主要内容是关于NSA(Natively Sparse Attention,原生稀疏注意力)。据介绍,这是一种用于超快速长文本训练与推理的、硬件对齐且可原生训练的稀疏注意力机制。

同时,记者注意到,在这篇论文的署名中,『DeepSeek』创始人梁文锋也作为共创在列。

『DeepSeek』发布最新技术论文报告

记者注意到,在这篇《原生稀疏注意力:硬件对齐且可原生训练的稀疏注意力机制》(Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention)的论文署名中,『DeepSeek』创始人梁文锋也作为共创在列。

今日霍州(www.jrhz.info)©️

根据论文摘要,『DeepSeek』团队表示,业界越来越认识到长上下文建模对于下一代大型语言模型的重要性。然而,随着序列长度的增加,标准注意力机制的高复杂度成为了关键的延迟瓶颈。

据悉,NSA通过高效的长序列处理能力,使模型能够直接处理整本书籍、代码仓库或多轮对话(如千轮客服场景),扩展了『大语言模型』在文档分析、代码生成、复杂推理等领域的应用边界。

NSA通过针对现代硬件的优化设计,在提高推理速度的同时、降低预训练成本,而不会牺牲性能。它在通用基准测试、长文本任务和基于指令的推理中均能达到或超越全注意力模型的表现。稀疏注意力为提高效率同时保持模型能力提供了一个有前景的方向。

今日霍州(www.jrhz.info)©️

一位网友评论道:“稀疏注意力机制确实能减少计算开销,『DeepSeek』的NSA架构虽然新颖,但在实际部署中,还得看具体应用场景和硬件优化,不能光看浏览量。”

“开源”激起AI迭代浪潮

1月20日,『DeepSeek』推出了人工智能模型『DeepSeek』-R1。此后,『DeepSeek』火遍全网。

2月18日,大模型创业公司阶跃星辰开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。阶跃星辰称,AGI的实现离不开全球开发者的共同努力,阶跃星辰开源的初心,是希望跟大家分享最新的多模态大模型技术成果,为全球开源社区贡献一份来自中国的力量。

围绕开源,相关生态也不断建设与完善。

商汤相关负责人透露,面向开发者的一站式开源Agent应用开发框架——LazyLLM即将在2025全球开发者先锋大会亮相。据介绍,该框架以数据为核心,支持在应用开发过程中持续迭代数据,从而不断提升数据效果。该框架也能通过精细化模块设计和符合直觉的代码风格,使开发者能够更快地实现想法产品落地。

“为更好提供价值,商汤将保持产品开放性,接入更多、更好的模型。”商汤相关负责人表示,随着AI技术不断迭代,AI商业化最终落脚点还是在客户价值。如何更好服务C端和B端用户尤为关键。

技术迭代仍是大模型企业的攻关要点。“目前,团队正在底层生态方面加快自主创新。团队会加快优化‘线性注意力’机制,也将继续打造多模态模型。”MiniMax(上海稀宇科技有限公司)相关负责人告诉记者,高水平模型的持续开源,能够让更多人免费体验到优秀大模型的技术能力,这将进一步提高AI渗透率。

特别声明:[『DeepSeek』发布最新技术论文!梁文锋参与署名] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

细软扁塌发救星!2026控油蓬松护发精油品牌推荐:这6款清爽好用不粘腻(为什么月末来姨妈,下次就月初来)

为解决细软扁塌发、油头的护发痛点,我实测了16款热门控油蓬松护发精油,从控油时长、蓬松持久度、成分温和度等维度打分,最终筛选出6款实力派,其中ZWR护发精油凭借全场景适配性拿下综合高分,成为熬夜党、通勤党的宝…

细软扁塌发救星!2026控油蓬松护发精油品牌推荐:这6款清爽好用不粘腻(为什么月末来姨妈,下次就月初来)

年前逆袭指南:12个急救焕肤小妙招,零成本养出“新年发光肌”丨战痘宣颜(逆袭前任)

3. 定期去角质:油性皮肤每周1-2次,干性皮肤每周1次,用温和的去角质产品(如果酸、酵素类),帮助代谢老废角质,让皮肤更透亮。 4. 湿敷急救法:用化妆棉或压缩面膜浸透化妆水(选择成分简单的保湿水),敷在…

年前逆袭指南:12个急救焕肤小妙招,零成本养出“新年发光肌”丨战痘宣颜(逆袭前任)

尚铁龙:16岁就开始扮演老头,颜值限制不了戏路,年近古稀照样火(尚铁龙年轻照片)

看似平凡的他,在几十年的演艺道路上,展现出了惊人的坚持与独特的风格。如今,年近古稀的他依旧活跃在演艺圈中,这不仅仅是为了谋取生计,更是一种对艺术的热爱与敬畏。看到他在银幕上依旧生龙活虎,我们心中也充满了踏实与…

尚铁龙:16岁就开始扮演老头,颜值限制不了戏路,年近古稀照样火(尚铁龙年轻照片)

『陈晓』华晒与何广沛探监戏花絮照,预告今晚高潮位!将与对方做了断(『陈晓』华身材)

今天(26日)下午,『陈晓』华在自己的『社交平台』上发布了几张探监戏份的花絮照,并配文透露,今晚的剧情将迎来一场两人之间的了断,让人不禁充满期待。 这一场长达六页纸对白的心理博弈,不仅是两人之间情感的激烈碰撞,更…

『陈晓』华晒与何广沛探监戏花絮照,预告今晚高潮位!将与对方做了断(『陈晓』华身材)

国区今天开始登记!藤原浩 x UNION x AJ1 别错过!(登录国服)

融合了 Union 的解构潮流美学和藤原浩一贯的蓝白黑 “闪电” 配色方案,这双高帮的 Air Jordan 1无论在颜值还是联名规格方面,都无懈可击。 3 款配色的货量都不大,传言中国区发售的这款蓝白红…

国区今天开始登记!藤原浩 x UNION x AJ1 别错过!(登录国服)