DeepSeek创始人梁文锋说,“所有的套路都是上一代的产物,未来不一定成立”;宇树科技创始人王兴兴表示,“AI驱动机器人每天进化非常快,基本上速度是超过我预期的,每天给我的惊喜也非常大”;大疆创始人汪滔认…
DeepSeek创始人梁文锋说,“所有的套路都是上一代的产物,未来不一定成立”;宇树科技创始人王兴兴表示,“AI驱动机器人每天进化非常快,基本上速度是超过我预期的,每天给我的惊喜也非常大”;大疆创始人汪滔认…
但在这前后,他都始终保持着低调,一如他率领的那个推出DeepSeek大模型的AI技术团队——除了偶尔崭露头角的论文,业界对他和他们的了解,并不比半年前多了多少。2025年5月,在不少实习生招聘平台上都出现了…
5月16日消息,近日DeepSeek创始人梁文锋等人发表了一篇名为《Insights into DeepSeek-V3: ScalingChallenges and Reflections on Hard…
通信方面,DeepSeek-V3 采用了多层胖树网络(Multi-Plane Fat-Tree),避免不同任务流量冲突;在模型推理时,还将「注意力计算」和「专家间通信」分阶段执行,利用流水线并行(DualP…
在财报分析师电话会上,吴泳铭分享了 AI 领域的两大最新趋势:一是在大中型企业,AI 应用开始从内部系统向用户侧场景渗透;二是积极使用 AI产品的客户,从大中型企业延展到大量中小企业,「2026 财年,我…
但随着DeepSeek横空出世,并宣布开源之后,这些国家一看,我们现在也掌握了DeepSeek这种先进算法了,那美国人似乎也没有那么可望不可及呀! 你只能把有限的资源,都在选定的一条或数条路径上,如果选错了…
DeepSeek 表示,DualPipe 曾在 V3R1 的训练中使用,是一种用于计算 - 通信重叠的双向 pipeline 并行算法。训练配置文件数据展示了 DeepSeek 在 DualPipe 中…
南都记者获悉,梁文锋是位80后,来自广东湛江吴川,他成长于一个普通家庭,父母为人淳朴,都是小学语文老师。 2月26日,何世豪在接受南都记者采访表示,“现在主要是扩大了科研思路,想在博后这段时间多做一些事情,…
这些消息人士并未提供DeepSeek R2的新发布日期。外媒表示,目前对DeepSeek的下一代人工智能模型知之甚少,但该公司希望R2在编程技能上有改进,并能够用英语以外的语言进行推理。 自1月发布以来…
2月18日,浙江杭州余杭区经济高质量发展大会上,灵伴科技(Rokid)创始人兼CEO祝铭明,佩戴公司最新AR眼镜 RokidGlasses现身大会。 祝铭明介绍,天宫一号上宇航员佩戴的眼镜就来自灵伴科技,…
2月18日,就在DeepSeek论文发布当天,月之暗面创始人杨植麟也带领团队发布最新论文《MoBA: MIXTURE OF BLOCKATTENTION FOR LONG-CONTEXT LLMS(直译为…
据悉,NSA通过高效的长序列处理能力,使模型能够直接处理整本书籍、代码仓库或多轮对话(如千轮客服场景),扩展了大语言模型在文档分析、代码生成、复杂推理等领域的应用边界。MiniMax(上海稀宇科技有限公司)…
虽然梁文锋强调自身的目标是通往AGI(通用人工智能),但DeepSeek与幻方量化、量化私募是脱不了的。 科技日报作如此小结——无论DeepSeek未来成就几何,但其已有力地破除了三个困扰国人的迷思:其一,…
这是DeepSeek团队在稀疏注意力领域的创新性工作,结合了算法创新和硬件优化,旨在解决长上下文建模中的计算瓶颈。更重要的是,在处理64k长度的序列时,NSA在解码、前向传播和反向传播等各个阶段都实现了显著的…
可如今,它已经真真切切地走进了我们的生活,改变着我们的工作方式,甚至影响着整个世界的格局。 Deepseek的成功,也给了我们一个启示:在科技领域,没有什么是不可能的。就像梁文锋,他也不是一开始就站在山顶上的…
梁文锋,这个今年刚进入不惑之年的广东人,在杭州这块福地上,创造了令全世界震惊的奇迹。 他们都是在各自的领域里独领风骚,干出了不平凡的业绩。 梁文锋:我们选人的标准一直都是热爱和好奇心,所以很多人会有一些奇特…
最近火爆全球的Deepseek的创始人梁文锋,广东湛江人,本硕都就读于浙江大学的电子信息与通信工程。根据公开信息,梁文锋的硕士毕业论文题目是《基于低成本PTZ摄像机的目标跟踪算法研究》。 2019年,其资…
我们对“杭州以一城之力反超美国”这句话并不认可,如果非要这么说,更精确一点,这种反超的主体其实并不应该是一个国家或者一座城市,而应该是城市里那些具体的人们,是从马云到梁文锋们一代又一代的杭州的企业家们,一直…
某实验数据显示,中国学生在标准测试中的平均得分比美国学生高15%,但在开放性创新课题中的主动突破率仅为后者的13。斯坦福创新实验室的跟踪研究表明,美国工程师平均每3次尝试就有1次突破现有框架,而中国工程师前…
与先前引发全球AI圈轰动的R1大模型类似,Janus-Pro同样是“小力出奇迹”的成果。时至今日,字节在AI大模型领域的“大力出奇迹”收到了一些效果。 就在DeepSeek成为焦点的这几天,字节被曝出今年…
特别在2008年全球金融危机之际,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,这一经历为他日后的职业生涯奠定了坚实的基础。 2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年…
来源:环球市场播报 近日,国内游戏科学领域的领军人物冯骥在游戏科学官方平台上,对DeepSeek大模型表达了高度赞赏,称其为“国运级别的科技成果”。这一评价迅速在游戏及科技圈内引起了广泛关注。冯骥在发文中详细…
钛媒体App 1月27日消息,天眼查显示,DeepSeek的开发者为杭州深度求索人工智能基础技术研究有限公司(简称“深度求索”),该公司成立于2023年7月份,由宁波程恩企业管理咨询合伙企业(有限合伙)和梁文…