上海AI企业发布全球首个混合架构开源模型

上海AI企业发布全球首个混合架构开源模型

人民网上海6月18日电 6月17日,总部位于上海徐汇的AI企业MiniMax(稀宇科技)正式发布其自主研发的MiniMax-M1系列模型,M1被定义为“全球首个开源的大规模混合架构推理模型”。

技术报告显示,M1模型在处理百万级Token的长文本上实现了重大突破,支持高达100万Token的上下文窗口,成为上下文最长的推理模型。此外,它还支持8万Token推理输出,为处理复杂文档分析、长篇代码生成等任务提供了可能性。

开源技术报告截图

MiniMax-M1的卓越性能,根植于其独特的架构设计和算法创新。其中,两大核心技术——线性注意力机制混合构架和更快的强化学习算法,构成了其高效能、低成本的基石。

分析人士认为,MiniMax此举不仅为开发者和企业提供了一个高性能、低门槛的新选择,也用事实证明了通过技术创新可以有效打破“算力-资本”的壁垒。这种“卷成本、卷效率”的竞争模式,将倒逼更多模型厂商走向真正的技术驱动和价值创造,而非停留在参数和估值的虚假繁荣中。

据了解,完整的M1模型权重、技术报告均已在Hugging Face和GitHub上开放获取。同时,公司正积极与国家超算平台、vLLM等业界主流开源框架合作,以确保开发者能够轻松、高效地部署和使用M1模型。

MiniMax相关负责人表示,M1的发布仅仅是MiniMax“开源周”的序幕。在接下来的四个工作日里,MiniMax计划每天发布一项新的技术或产品更新,持续为AI社区带来惊喜。

特别声明:[上海AI企业发布全球首个混合架构开源模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

天津美食有哪些必吃推荐?老天津人私藏清单大公开!(天津美食有哪些?)

来天津旅游或探亲,怎能不吃地道风味?本文带你解锁天津十大经典美食:从百年老字号狗不理包子到街头巷尾的煎饼果子,揭秘背后的历史渊源、制作工艺与口感秘诀。不仅告诉你“吃什么”,更教你怎么选、怎么吃才正宗!附上价格参考与避坑指南,让你轻松当个懂行

天津美食有哪些必吃推荐?老天津人私藏清单大公开!(天津美食有哪些?)

iPhone 17全系跑分曝光 A19 Pro表现亮眼

9月15日,安兔兔发布了一张iPhone 17系列新机的跑分图。图片显示,搭载苹果A19 Pro处理器的iPhone Air综合跑分比搭载A19处理器的iPhone 17低了超过15万分

iPhone 17全系跑分曝光 A19 Pro表现亮眼

金龟子为给外孙办百天宴!多位少儿主持人现身,王宁站角落显憔悴(金龟子是谁)

今,这个家庭又迎来了新的生命——金龟子的大女儿王逸宸,在今年三月份诞下了自己的宝宝“小金宝”,为这个家庭增添了更多的欢乐与温馨。他们看着自己的孙子一天天长大、一天天变得可爱和聪明,心中充满了喜悦和自豪。 在这…

金龟子为给外孙办百天宴!多位少儿主持人现身,王宁站角落显憔悴(金龟子是谁)

太好笑!这期《你好星期六》『檀健次』成“人型道具”『李一桐』黄子爆梗(太好笑了什么意思)

三线谜回》剧组的『孟子义』与『王弘毅』携手亮相,『李一桐』、张颜齐、黄子弘凡、『檀健次』、『李雪琴』以及杨迪共同参与,旅行团乐队的压轴登场更为音乐环节增添专业色彩。『檀健次』更化身1"人形道具1",从被张颜齐触发1&q

太好笑!这期《<strong>你好星期六</strong>》『檀健次』成“人型道具”『李一桐』黄子爆梗(太好笑了什么意思)

这是我见过最“贵气”的女人:年过60仪态端庄,气质优雅又高级

在发型的选择上,奚美娟老师注重利落与大气的结合,这一点非常重要,我们不能去尝试太过于夸张的造型设计,否则容易拉低我们的颜值指数,但也不能一味地追求低调, 在发型的设计上,可以选择一些能够凸显出自己五官的设…

这是我见过最“贵气”的女人:年过60仪态端庄,气质优雅又高级