中国2家AI公司连发新模型赶超OpenAI o1 海外开发者:速度难以置信

中国2家AI公司连发新模型赶超OpenAI o1 海外开发者:速度难以置信

“3 个领先模型中有 2个来自中国实验室?中国追赶的速度真是令人难以置信。”在美国知名技术社区Hacker News,一位开发者如此感叹。“中国初创公司已展现出赶超美国人工智能模型的迹象,而且他们追赶的速度比许多业内人士预期的要快。”美国《华尔街日报》的12月24日的一篇报道中,也通过对比中美两国AI企业推理模型的表现以和研发速度,得出上述结论。

据了解,1月20日,国内两家备受关注的人工智能大模型创业公司月之暗面(Kimi)和深度求索(DeepSeek)几乎在同一时间发布了最新模型,都在性能测试中超过OpenAI的o1正式版模型。

在月之暗面发布的k1.5多模态思考模型中,多模态思考模型实现了SOTA级别多模态推理和通用推理能力。(注:SOTA通常指某个领域中最先进的技术或方法)short-CoT模式下,Kimi k1.5的数学、代码、视觉多模态和通用能力,大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet的水平,领先达到550%;而在long-CoT模式下,Kimi k1.5的数学、代码、多模态推理能力,也达到长思考SOTA模型OpenAI o1正式版的水平。

而深度求索发布的DeepSeek-R1在后训练阶段大规模使用强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

不到两个月,两家中国企业推出的推理模型都实现了对OpenAI o1正式版的对标甚至超越,而与OpenAI不同,两家中国公司都公开了他们的原理及技术报告:Kimi k1.5发布原创技术long2short,高效思维链+原生多模,DeepSeek R1则继续主打高性价比。报告一出,引来大量海外从业者的解读和关注。

英伟达高级科学家范麟熙(Jim Fan)在社交媒体发文表示,“两篇论文披露了大量技术细节,并惊人得出相似结论,假期读到令人鼓舞。”

Answera公司创始人保罗·库弗特(Paul Couvert)也感叹,“两款中国o1同日发布,中国AI追赶速度越来越快。”

对此,中央民族大学教授郭全中表示:"中国AI公司之前基本都在摸着Open AI的石头过河,但从K1.5等国产大模型开始,以硅谷为中心的格局已悄然发生变动。国产大模型的突破不仅在于技术指标的提升,也展示了中国AI技术正在走向自主创新的新阶段。期待看到更多中国企业在全球AI舞台上展现实力,推动人工智能技术向着更高水平迈进。”

(环球网)

猜你喜欢

杨幂上合电影节发言获赞, 从“流量女星”到“实力演员”, 华丽转身展现新高度

在这一刻,她已不再是频繁出现在热搜榜上的“流量女星”,而是凭借她深厚的表演功底和深情的演讲,向观众展现了作为演员的另一面。这一句金句总结了她的观点,阐释了“光影为桥”的核心理念——电影不仅是艺术,更是连接不同…

杨幂上合电影节发言获赞, 从“流量女星”到“实力演员”, 华丽转身展现新高度

Falconeri 呈献「慢活之艺」主题大片 亚麻织就的意式田园诗

在远离喧嚣的乡间田野中,兼具清爽、轻盈、通透与舒适质感的亚麻面料化身为慢生活主角,编织出一首献给意大利田园的视觉颂歌。每一抹色彩都与自然环境和谐交融,令人联想起黄昏的暖光与阳光明媚的慵懒午后。 「慢活之艺」是…

Falconeri 呈献「慢活之艺」主题大片 亚麻织就的意式田园诗

程序员是干什么的

与客户或产品经理沟通,理解用户需求,确定软件的功能和性能。 移动开发:负责开发手机App,包括iOS和Android平台。 学习能力:技术更新迭代很快,需要不断学习新的知识和技能。他们的工作不仅需要技术能力…

程序员是干什么的

技术领航,风靡赛场!Barsetto百胜图如何成为咖啡赛事“心脏引擎”

Barsetto百胜图的故事始于1898年意大利罗马,Ceccarelli家族在街头开设的“BarsettoCaffè”咖啡馆,不仅成为意式咖啡文化的发源地之一,更奠定了品牌对品质的极致追求。 赛事之外,…

技术领航,风靡赛场!Barsetto百胜图如何成为咖啡赛事“心脏引擎”

海外社交平台泄露Meta AR眼镜新品图片、UI信息

眼镜配套APP为《Meta AI》,产品正面外观是左闪光灯右摄像头的经典组合。产品支持导航、翻译、AI等,以下是部分功能图标以及截图。眼镜本体可通过镜腿触摸板交互,并在Ray-Ban Meta的基础上引入…

海外社交平台泄露Meta AR眼镜新品图片、UI信息