阿里千问引美国恐慌?50美元💵训出顶尖模型,逼得美国动歪招?(阿里 qiankun)
而咱们中国企业选了条完全不同的路,不管是阿里千问、百度千帆,还是清华的GLM,都选择了开源,就这么一个选择,让中美AI竞争的核心从物质层面,转到了模型生态的较量上。 这种对比就很明显了:美国AI企业砸的钱更…
而咱们中国企业选了条完全不同的路,不管是阿里千问、百度千帆,还是清华的GLM,都选择了开源,就这么一个选择,让中美AI竞争的核心从物质层面,转到了模型生态的较量上。 这种对比就很明显了:美国AI企业砸的钱更…

通过相关性分析,研究团队发现了AI判断的另一个特点:虽然AI在绝对评分上可能与人类存在偏差,但在排序任务上表现要好得多。他们建议将这项研究的数据集用于训练更专业的AI评估模型,通过强化学习和人类反馈机制进一…

据《The Information》8 月 29 日披露,Meta 旗下新成立的超级智能实验室(Meta SuperintelligenceLabs)已启动与谷歌、OpenAI 的合作谈判,计划将前者的 G…

Meta超级智能实验室的管理团队已探讨过采用谷歌Gemini或OpenAI的模型,在旗下聊天『机器人』️应用MetaAI中回答用户提问,并为其他AI功能提供支持。他随后对AI团队进行重大调整,聘请亚历山大·王和纳特…

但有趣的是,继华为之后,AMD这位"红色巨人"正在悄然布局一场漂亮的突围战——不仅要在硬件性能上硬碰硬,更要在软件生态这片"无人区"开辟新战线。 AMD的聪明之处在于,

这封信中还透露出一个信号,即 meta 正在改变其发布 AI 模型的方式,以追求超级智能。 尽管 AI 所带来的未来令人期待,但它对我们生活产生的最深远影响,很可能来自于每个人都拥有一个个人超级智能(per…

不止刘璐,OpenAI的核心团队成员Allan Jabri也随之加入了Meta,两人的加入被认为是扎克伯格战略性挖掘的关键一步。扎克伯格显然在全力重建Meta的AI阵容,尤其是在Llama项目的开源方向上,…

来源:格隆汇APP 格隆汇7月19日|据全球大模型竞技场LMArena消息,开源模型与闭源模型的竞争进一步升级。在全球开源模型排行榜中,KimiK2、『DeepSeek』 R1、Qwen3等3个来自中国的开源模…

格隆汇7月9日|据AIGC开放社区,今天凌晨,全球著名大模型开放平台HuggingFace开源了,顶级小参数模型SmolLM3。SmolLM3只有30亿参数,性能却大幅度超过了Llama-3.2-3B 、Q…

天眼查财产线索信息显示,近日,鸿海精密工业股份有限公司申请注册“FoxBrain”商标™️,国际分类为科学仪器,当前商标™️状态为等待实质审查。 据媒体报道,FoxBrain是鸿海集团(富士康)旗下鸿海研究院自主研…

Llama Nemotron Nano VL 基于 Llama 3.1 架构,融合了 CRadioV2-H 视觉编码器和 Llama 3.18B 指令微调语言模型,能同时处理多页文档中的视觉和文本元素,支…

本报告围绕『大语言模型』(LLM)的基础概念、技术演进、实际应用及未来发展展开系统介绍,结合技术原理与实操演示,为入门者提供全面的知识框架。 报告总结了LLM的核心知识、部署流程及伦理思考,并推荐学习资源,如H…

据《华尔街日报》报道,Meta推迟了旗舰AI模型Llama 4 Behemoth的发布,原因是担心该模型在关键基准测试中表现不佳。为推动相关产品的发展,Meta与一些托管其Llama模型的公司签订了收益分成…

5 月 8 日消息,Mistral 当地时间 7 日推出了 Mistral 3 系列模型的中等量级版本 Medium3,宣传其同时具有前沿级别的性能和明显更低的成本,并具备多种企业功能。 Mist…

开发者Maciej Witkowiak成功将Llama2模型移植到1982年发布的Commodore 64电脑上运行,虽然生成的故事像3岁孩子的胡言乱语,但在如此古老的硬件上实现AI运行已是惊人突破。#AI黑…

1.4月25日上午,国家数据局首个正局级事业单位——国家数据发展研究院正式揭牌,标志着我国在数据要素市场化配置、数据治理和国际合作方面迈出重要一步。6. 据界面新闻,当地时间4月25日,Meta和博思艾…

Meta公司刚刚发布Llama 4 Scout与Llama 4 Maverick,但随后就被曝出模型训练测试集作弊。在海外留学求职交流论坛“一亩三分地”上,发帖人自称是参与Llama 4训练的内部员工,他表…

据欧盟委员会4月4日消息,欧盟与中亚国家领导人于当日在乌兹别克斯坦举行首次欧盟-中亚峰会,欧盟将启动总额为120亿欧元💶的“全球门户投资计划”,支持欧盟和中亚国家在交通基础设施、关键原材料、清洁能源和数字互联…

报告对2025年第一季度的漏洞数据进行多维度梳理,涵盖漏洞分布概况、重点漏洞回顾以及AI领域的安全资讯,旨在帮助用户识别风险、保护资产。微软在野漏洞:微软披露了多个在野利用漏洞,涉及『Windows』 Hype…

虽然Meta是开源模型的重要奠基者,但是开源领域的竞争正变得日益激烈和焦灼,尤其是『DeepSeek』的崛起,对Meta在开源模型社区的领先地位构成了巨大的冲击。4月4日,『DeepSeek』与清华大学研究团队联合…

在 『DeepSeek』 掀起的这轮开源模型浪潮中,有一个开源王者似乎被遗忘了——Meta AI。 ???? 2880 亿激活参数量,总参数 2万亿(消费级根本跑不动) ???? 目标:在多模态处理与推理能力上实现突…

【新智元导读】本文介绍了当前最受科研人员青睐的AI模型,推理出色的o3-mini、全能型『DeepSeek』-R1、科研常用的Llama、编程利器Claude3.5 Sonnet和开源『明星』️Olmo 2,它们各…

3 月 24 日消息,『DeepSeek』 在其官方交流群宣布称,『DeepSeek』-V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API 接口和使用方式保持不变。…

月 22 日消息,当地时间周四,AMD 宣布推出专为本地运行『大语言模型』(LLM)设计的应用 GAIA(发音为ˈɡaɪ.ə)并在 Github开源,目前仅限于 『Windows』 平台。AMD 表示,Ryze…

3月7日, 据英国金融时报,知情人士表示,Meta计划在其最新的开源大型语言模型Llama 4中引入改进的语音功能,预计将在未来几周内推出。该公司押注未来所谓的人工智能代理将是对话式的,而不是以文本为主导的。…

Meta首席产品官Chris Cox周三表示,即将推出的Llama 4AI软件将有助于增强AI代理的能力,是生成式AI领域的最新趋势。Cox表示,Llama 4将具有推理能力,并创建能够使用网页浏览器和其他…

『DeepSeek』的MoE架构,在R1、V3两个不同模型上的对比技术亮点 量化加速FP8的特点对比Deepseek原论文中量化章节的解读REST API调用:深度学习系统部署的常用方式针对AI算法的部署框架第…

记者从第四范式了解到,2月25日,,用户在端侧可轻松部署包括『DeepSeek』 R1、Qwen 2.5、Llama 23系列等小尺寸蒸馏模型,并实现离线运行。成本优化方面,端侧部署可有效降低对云端资源的依赖,…

至于最终选择不开源的原因,李彦宏称,“当时的判断是,市场上一定会有开源的模型,而且是不止一家会开源。 而最后的结果也显而易见,在『DeepSeek』完全开源的攻势之下,别说百度,就连OpenAI也已经无力抵挡,表…
