月之暗面:很早就验证过长思维链,因成本高不够重视

月之暗面:很早就验证过长思维链,因成本高不够重视

2月17日消息,上个月Kimi 发布的多模态推理模型k1.5,今日月之暗面官方分享了k1.5模型诞生的过程。

月之暗面研究员Flood Sung表示,去年9月12号OpenAI o1发布,长思维链(推理模型背后的关键技术)的有效让他陷入反思。

因为长思维链的有效性其实在一年多前就已经知道了,月之暗面Kimi联合创始人Tim周昕宇很早就验证过,使用很小的模型,训练模型做几十位的加减乘除运算,将细粒度的运算过程合成出来变成很长的思维链数据做监督微调,就可以获得非常好的效果。“我依然记得当时看到那个效果的震撼。”

“我们意识到长上下文的重要性,所以率先考虑把文本搞长,但却对长思维链这件事情不够重视。其实主要还是考虑了成本问题。”他表示,长上下文主要做的是长文本输入,有Prefill预填充,有Mooncake加持,成本速度可控,而长思维链是长文本输出,成本高很多,速度也要慢很多。在这种情况下,把输出搞长就没有成为一个高优选项。

该研究员称还有什么比性能更重要呢?成本和速度有摩尔定律加持,可以不断下降,只要把性能搞上去,剩下的都不是主要问题。“所以,我们得搞长思维链,搞 o1。”

他还提到在实际训练的过程中有了重要的发现:模型会随着训练提升性能也不断增加token数,也就是这是RL训练过程中模型可以自已涌现的,“这个和友商 Deepseek的发现几乎是一样的。”

特别声明:[月之暗面:很早就验证过长思维链,因成本高不够重视] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

医疗耗材数字化领用白皮书:以低值耗材为切入口的AI无人领用仓在医疗场景下(医用耗材信息化管理)

今天分享的是:的实践与价值 报告共计:45页 在国家推动智慧医院建设、DRGDIP支付改革等政策驱动下,医疗行业数字化转型加速,低值耗材管理因长期粗放、数字化水平低成为改革重点。当前低值耗材管理存在以领代支…

医疗耗材数字化领用白皮书:以低值耗材为切入口的AI无人领用仓在医疗场景下(医用耗材信息化管理)

小哥不闯红灯一周领700元 安全增收新风尚(不闯红灯是什么意思)

在上海,遵守交通规则的外卖小哥们获得了新的奖励。8月1日,美团在上海举办了一场“不闯红灯”系列活动的线下表彰仪式,20位骑手代表在现场领取了“等灯奖”。这项奖励活动自7月21日开始,针对配送途中不闯红灯并完成指定单数的骑手

小哥不闯红灯一周领700元 安全增收新风尚(不闯红灯是什么意思)

泡泡玛特记得给Lady Gaga打钱(泡泡玛特里面有啥)

, ,, Lady Gaga最新街拍,爱马仕包包上挂的红色Labubu是由艺术家Marko Monroe为Lady Gaga特别定制!…

泡泡玛特记得给Lady Gaga打钱(泡泡玛特里面有啥)

智能文本抽取之大模型基座选型(智能文本信息抽取)

在智能文本抽取(如结构化信息提取、关键字段识别、文档理解等)任务中,大模型基座的选型直接影响效果上限与落地成本。Prompt工程结构化输出要求(如JSON Schema),减少后处理成本:数据增强合成数据训练…

智能文本抽取之大模型基座选型(智能文本信息抽取)

万达电影星伙伴再添新成员!携手姚琛持续深化娱乐生态布局(陈丽君万达电影星伙伴)

这也是继8月4日官宣的陈丽君之后,万达电影星伙伴再次官宣新成员。 根据公开信息,姚琛目前待播作品中的《万古最强宗》与《耀眼》,均为万达电影2025超级娱乐剧集片单中的重点精品电视剧项目。万达电影表示,将携手…

万达电影星伙伴再添新成员!携手姚琛持续深化娱乐生态布局(陈丽君万达电影星伙伴)