春节击败奥特曼,杭州学霸凭啥震撼全球

春节击败奥特曼,杭州学霸凭啥震撼全球

奥特曼在中国春节期间,感受到了极大压力。

外国好学生,终于在中国学霸的战斗力前,有了“战五渣”之感。

宛如怪兽一般的学习能力,奥特曼出现了“这道题我不会做”之感。

这两天,中国人工智能初创公司深度求索(DeepSeek)成为全球科技圈热议的主角。

就在刚刚过去的24小时内,DeepSeek AI智能助手同时登顶中美iOS免费应用排行榜第一,刷爆国内外社交平台,应用更是多次被“挤”到宕机。

就在昨日(1月28日除夕)凌晨,DeepSeek在GitHub平台发布了Janus-Pro多模态大模型,进军文生图领域。

这简直就是让全球互联网科技圈一起过上中国年。

前谷歌首席执行官埃里克·施密特在28日的文章里说:DeepSeek的崛起标志着全球人工智能竞赛的“转折点”,证明中国可以用更少的资源与大型科技公司竞争。

同日,OpenAI首席执行官山姆·奥特曼在社交平台X上表示,DeepSeek“令人印象深刻”,尤其是考虑到以这个价格提供的功能。

他表示OpenAI“当然会推出更好的模型”,有新的竞争对手也确实令人振奋。

山姆·奥特曼同时也是“ChatGPT之父”。

美国媒体报道称,这是人工智能领域的一场“地震”,“从华盛顿到华尔街再到硅谷都感受到了震动”。

美国总统特朗普则称DeepSeek的出现“给美国相关产业敲响了警钟”。

震荡也一度惊呆了股市。

27日,据外媒报道,道琼斯市场数据显示,当地时间周一的“市场大屠杀”总共使股市市值蒸发了约1万亿美元。

其中,欧美科技股重挫。AI龙头英伟达暴跌16.97%,单日市值蒸发5890亿美元,创史上最大单日个股市值蒸发纪录。

DeepSeek可谓是用最少的钱,干最多的事。

其推出的模型,在性能上和世界目前顶尖的GPT-4o等大模型不相上下。

但在成本上,OpenAI训练ChatGPT-4花费的成本高达7800万美元,还可能达到1亿美元。

而DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。

新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。

DeepSeek由梁文峰于2023年5月创立,他曾领导中国对冲基金幻方(High-Flyer Quant)。

由于幻方完全承销了DeepSeek,这家初创公司可以自由地进行雄心勃勃的AI研究,而不会受到产生短期回报的压力。

DeepSeek位于中国杭州,聚集了一支由中国大学顶尖毕业生组成的年轻团队,强调强大的技术技能而非传统的工作经验。

从第一天起,DeepSeek就以两个核心目标为导向:以透明、开源的方式推动通用人工智能(AGI);通过激进的定价和成本效益高的技术,使先进的AI更容易获得。

据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

尤其是在,在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。

这群杭州小伙,凭什么击败奥特曼,震撼全世界?

对此,时代周报记者庞宇和书乐进行了一番交流,本猴以为:

好学生和学霸的鸿沟,才是这一波人工智能震撼中的关键。

在仅有极少标注数据的情况下,极大提升了模型推理能力,这就是学霸的学习方法。

这就相当于是说,它(DeepSeek-R1)生成的内容不仅仅依靠已经标注给它的数据,而是它可以根据标注内容去思考、反向标注更多的东西。

DeepSeek实际上提供了一个思路,就是人工智能如何完成从“好学生”到“学霸”的突破。

我们之前的人工智能就像一个“好学生”,通过深度学习,对资料进行反复的消化吸收,然后生成答案。

这些资料就相当于是课本,好学生一旦遇到课本之外的超纲题就不会做了。

而DeepSeek就像掌握了课本里方法论的“学霸”,能够举一反三,通过学习课外读物,扩大知识面,而这些课外读物不一定是标注好的。

DeepSeek的成功起到示范作用,它证明了AI初创公司确实能够在大模型上打破大厂垄断的局面,甚至超越国内外巨头。

这才是最刺激人心的东西,所以导致了科技股的震荡。

作者 张书乐,人民网、人民邮电报专栏作者,中经传媒智库专家,资深产业评论人

特别声明:[春节击败奥特曼,杭州学霸凭啥震撼全球] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

【社博会】安利智机器人赋能社区服务业,助力安保行业技术革新!(社博软件是干嘛的)

自研的门卫机器人和巡检机器人拥有积累了三十年的安保行业经验。 安利智公司搭建的社区居家养老服务平台以自主研发的智能医养管家机器人为智能终端,整合了社区周边的医疗和养老服务资源,平台配套的机器人社区服务中心拥有…

【社博会】安利智机器人赋能社区服务业,助力安保行业技术革新!(社博软件是干嘛的)

营销自动化案例深度解析(营销自动化例子)

问题提出一家中型电商企业面临着营销效率低下的困境。他们拥有丰富的用户数据,却无法有效利用这些数据实现精准营销。市场部门疲于应付各种重复性工作,如邮件发送、社交媒体管理、客户跟进等,导致创意工作的时间被大量挤…

营销自动化案例深度解析(营销自动化例子)

北京:未来三天,京津冀等地将有新一轮较强降雨 多部门联动应对(北京未来三天天气趋势)

中央气象台预计,未来三天京津冀、东北地区、内蒙古中部、山西中北部、青海东部、甘肃中部、宁夏、陕西北部以及广东、广西东部和南部等地的部分地区将出现大到暴雨,局部地区有大暴雨,并伴有短时强降水、雷暴大风或冰雹等强对流天气

北京:未来三天,京津冀等地将有新一轮较强降雨 多部门联动应对(北京未来三天天气趋势)

儿童电话手表如何“回归正轨”她就用手表拍了一张照片发到朋友圈,希望朋友们点赞赢积分。(儿童电话手表如何注册微信)

这些孩子频繁地在各种场合使用智能手表。 虽然孩子们似乎很喜欢使用智能手表,但一些家长和老师却深感担忧,认为他们可能会沉迷其中。 一位高年级小学生告诉记者,当家长限制下载应用或添加好友时,一不留神就会没收孩子的…

儿童电话手表如何“回归正轨”她就用手表拍了一张照片发到朋友圈,希望朋友们点赞赢积分。(儿童电话手表如何注册微信)

特斯拉餐厅开业12天:排长队、机器人故障、居民抗议三件套齐发(特斯拉餐厅开业 马斯克称考虑全球扩展)

8月3日消息,据electre报道称,位于好莱坞圣莫尼卡大道的特斯拉复古未来主义餐厅自7 月 21 日开业以来,连续 12天陷入运营困境:就餐排队动辄一小时,Optimus 爆米花机器人因远程操控失误频繁停…

特斯拉餐厅开业12天:排长队、机器人故障、居民抗议三件套齐发(特斯拉餐厅开业 马斯克称考虑全球扩展)