阶跃星辰发布Step3,目标是做最好的开源多模态推理模型(阶跃星辰发布会3月23日)

阶跃星辰发布Step3,目标是做最好的开源多模态推理模型(阶跃星辰发布会3月23日)

界面新闻记者 | 伍洋宇

界面新闻编辑 | 刘方远

作为少数仍在坚持基础模型训练的创业公司,阶跃星辰刚刚公布了自己的最新进展。

7月25日,阶跃星辰正式发布第三代模型Step 3,并将于7月31日全球开源。Step 3采用MoE(混合专家模型)架构,总参数量321B,激活参数量38B。与行业趋势一致,它的最大亮点也在于降本增效。

据阶跃星辰创始人兼CEO姜大昕介绍,Step 3在架构设计阶段便考量了系统与硬件的特性,可实现广泛硬件平台上的高效推理。

具体而言,Step 3在国产芯片上的上下文32K推理效率最高可达DeepSeek-R1的300%;在英伟达Hopper架构芯片进行分布式推理时,实测相较于DeepSeek-R1的吞吐量提升超70%。

阶跃星辰联合创始人兼副总裁朱亦博对Step 3在国产芯片上的表现进行了简单的技术解释。

他表示,模型每推理一个token所访问的显存和进行的计算量,与其注意力机制有关。团队考虑到行业当前在英伟达H800和H20等芯片所受到的限制,在架构设计层面重点考量了国产芯片的计算特性,在访存比(计算量/访存量)斜率上优先贴近国产芯片,使其运行过程中不会出现严重的计算瓶颈或显存瓶颈。

姜大昕、朱亦博在讲解阶跃最新模型。图片来源:界面新闻

姜大昕在接受界面新闻等媒体采访时表示,大模型走到今天已经从GPT范式的1.0走到了强化学习范式下的2.0,当前坚持训练模型的公司正在变少,“每个行业节点都会有公司掉队。”

直到今天,阶跃星辰仍然坚持“超级模型+超级应用”的发展路径,并且坚定认为模型能力决定应用上限。

在模型能力究竟如何影响应用上限的问题上,姜大昕对界面新闻记者表示,模型智能的上限没有止境,但就像推理模型打开了代码等理科问题的应用市场,技术进步、模型能力上升的确会不断解锁应用。

他指出,多模态领域也开向强化学习过度,模型性能还有很大提升空间,比如未来可能做到“没有AI味的电影生产”。

为进一步实现大模型和算力双向价值最大化,阶跃星辰联合近10家芯片及基础设施厂商成立“模芯生态创新联盟”,在芯片、模型和平台全链路技术上进行合作。

该联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已实现Step 3的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行Step 3。

除了基础模型研发进展,阶跃星辰还发布了智能终端Agent和垂类Agent等领域的应用落地。

例如,阶跃星辰、千里科技和吉利汽车集团合作打造的智能座舱Agent OS(预览版),内嵌阶跃星辰的多模态大模型和端到端语音大模型。

阶跃星辰还在商业化方面披露了一个颇有野心的目标。

目前,Step 3模型在智能终端、智能座舱、金融、内容创作和城市治理等多个领域实现了商业化应用。据姜大昕透露,阶跃星辰计划将全年收入冲刺目标定为10亿元人民币。

负责商业化的阶跃星辰联合创始人、副总裁李璟对界面新闻等媒体表示,公司今年上半年合同收入规模已有数亿,确认收入和毛利水平都表现较好,今年全年有望完成10亿收入目标。

特别声明:[阶跃星辰发布Step3,目标是做最好的开源多模态推理模型(阶跃星辰发布会3月23日)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

偶遇何猷君一家,奚梦瑶和婆婆逛街尽显高情商,四太腿长不输媳妇(偶遇何猷君一句话概括)

这一天,奚梦瑶身穿黑色打底裤,搭配白色上衣和披肩外套,展现出高挑纤细的身材。何猷君时不时侧身倾身跟爱妻聊天,与婆婆同行的温馨场面让人倍感温暖,想必四太看到这融洽的氛围也会十分高兴。 网友们纷纷称赞奚梦瑶的情…

偶遇何猷君一家,奚梦瑶和婆婆逛街尽显高情商,四太腿长不输媳妇(偶遇何猷君一句话概括)

岁月不败美人,58岁的妮可·基德曼比20岁的她更好看(岁月不败美人,韶华不负流年)

哪怕在阴天和冬天,也坚持涂抹防晒——这点在多次采访中被她提到,是保持皮肤健康和年轻的秘诀之一。 她用几十年告诉我们:美或许是天赐的礼物,但如果想带她穿越青春伴随一生,是用自己的方式活出来的,比年纪,世俗的标…

岁月不败美人,58岁的妮可·基德曼比20岁的她更好看(岁月不败美人,韶华不负流年)

哭不出来别硬挤!瞪眼噘嘴、一脸狰狞的高叶,打脸了多少假哭演员(哭不出来是一种病吗)

演员们的演技也同样给力,尤其是高叶,她的表现堪称一绝。她的一场“哭戏”不仅让人心疼,还深深触动了每一个观众的心灵。 要说起哭戏,杨超越在古装剧中的表现简直让人忍俊不禁,尤其是在哭泣时那种五官的扭曲,虽然哭得很…

哭不出来别硬挤!瞪眼噘嘴、一脸狰狞的高叶,打脸了多少假哭演员(哭不出来是一种病吗)

八小时睡眠≠精力充沛,“质”不够,越睡越累是常态(八小时睡眠是否科学)

  “明明睡够了八个小时,醒来却像没睡一样,浑身乏力、脑袋发沉,一整天都提不起精神。”这样的困惑困扰着不少人。在多数人看来,“睡够时间”就等于“睡好了”,但实际上,决定身体是否恢复精力的关键,不在于睡眠时间的长短,而在于睡眠的“质”。忽略睡

八小时睡眠≠精力充沛,“质”不够,越睡越累是常态(八小时睡眠是否科学)

中国一滴都不买,对华出口归零,特朗普政府求锤得锤,美财长急了(《中国一点都不能少》)

H20芯片重新对华供应被中方视为"技术封锁失效"的信号。中国通过产业升级和自主技术创新,逐步摆脱对美国技术和市场的依赖。特朗普政府被迫调整策略,从对抗转向合作,但中方已建立更强大的经济防御体系。美国智库&

中国一滴都不买,对华出口归零,特朗普政府求锤得锤,美财长急了(《中国一点都不能少》)