上海AI企业发布全球首个混合架构开源模型

科技小镇与凉梦2025年09月18日 06:4867阅读

上海AI企业发布全球首个混合架构开源模型

人民网上海6月18日电 6月17日，总部位于上海徐汇的AI企业MiniMax(稀宇科技)正式发布其自主研发的MiniMax-M1系列模型，M1被定义为“全球首个开源的大规模混合架构推理模型”。

技术报告显示，M1模型在处理百万级Token的长文本上实现了重大突破，支持高达100万Token的上下文窗口，成为上下文最长的推理模型。此外，它还支持8万Token推理输出，为处理复杂文档分析、长篇代码生成等任务提供了可能性。

开源技术报告截图

MiniMax-M1的卓越性能，根植于其独特的架构设计和算法创新。其中，两大核心技术——线性注意力机制混合构架和更快的强化学习算法，构成了其高效能、低成本的基石。

分析人士认为，MiniMax此举不仅为开发者和企业提供了一个高性能、低门槛的新选择，也用事实证明了通过技术创新可以有效打破“算力-资本”的壁垒。这种“卷成本、卷效率”的竞争模式，将倒逼更多模型厂商走向真正的技术驱动和价值创造，而非停留在参数和估值的虚假繁荣中。

据了解，完整的M1模型权重、技术报告均已在Hugging Face和GitHub上开放获取。同时，公司正积极与国家超算平台、vLLM等业界主流开源框架合作，以确保开发者能够轻松、高效地部署和使用M1模型。

MiniMax相关负责人表示，M1的发布仅仅是MiniMax“开源周”的序幕。在接下来的四个工作日里，MiniMax计划每天发布一项新的技术或产品更新，持续为AI社区带来惊喜。

企业全球算法架构技术

特别声明：[上海AI企业发布全球首个混合架构开源模型] 该文观点仅代表作者本人，今日霍州系信息发布平台，霍州网仅提供信息存储空间服务。

猜你喜欢

2025-09-16

天津美食有哪些必吃推荐？老天津人私藏清单大公开！(天津美食有哪些?)

来天津旅游或探亲，怎能不吃地道风味？本文带你解锁天津十大经典美食：从百年老字号狗不理包子到街头巷尾的煎饼果子，揭秘背后的历史渊源、制作工艺与口感秘诀。不仅告诉你“吃什么”，更教你怎么选、怎么吃才正宗！附上价格参考与避坑指南，让你轻松当个懂行

天津美食有哪些必吃推荐？老天津人私藏清单大公开！(天津美食有哪些?)

2025-09-16

iPhone 17全系跑分曝光 A19 Pro表现亮眼

9月15日，安兔兔发布了一张iPhone 17系列新机的跑分图。图片显示，搭载苹果A19 Pro处理器的iPhone Air综合跑分比搭载A19处理器的iPhone 17低了超过15万分

iPhone 17全系跑分曝光 A19 Pro表现亮眼

2025-09-17

金龟子为给外孙办百天宴！多位少儿主持人现身，王宁站角落显憔悴(金龟子是谁)

今，这个家庭又迎来了新的生命——金龟子的大女儿王逸宸，在今年三月份诞下了自己的宝宝“小金宝”，为这个家庭增添了更多的欢乐与温馨。他们看着自己的孙子一天天长大、一天天变得可爱和聪明，心中充满了喜悦和自豪。在这…

金龟子为给外孙办百天宴！多位少儿主持人现身，王宁站角落显憔悴(金龟子是谁)

2025-09-17

太好笑！这期《你好星期六》『檀健次』成“人型道具”『李一桐』黄子爆梗(太好笑了什么意思)

《三线谜回》剧组的『孟子义』与『王弘毅』携手亮相，『李一桐』、张颜齐、黄子弘凡、『檀健次』、『李雪琴』以及杨迪共同参与，旅行团乐队的压轴登场更为音乐环节增添专业色彩。『檀健次』更化身1"人形道具1"，从被张颜齐触发1&q

太好笑！这期《<strong>你好星期六</strong>》『檀健次』成“人型道具”『李一桐』黄子爆梗(太好笑了什么意思)

2025-09-18

这是我见过最“贵气”的女人：年过60仪态端庄，气质优雅又高级

在发型的选择上，奚美娟老师注重利落与大气的结合，这一点非常重要，我们不能去尝试太过于夸张的造型设计，否则容易拉低我们的颜值指数，但也不能一味地追求低调，在发型的设计上，可以选择一些能够凸显出自己五官的设…

这是我见过最“贵气”的女人：年过60仪态端庄，气质优雅又高级