上海AI企业发布全球首个混合架构开源模型

科技2025-06-18阅读  2+

人民网上海6月18日电 6月17日,总部位于上海徐汇的AI企业MiniMax(稀宇科技)正式发布其自主研发的MiniMax-M1系列模型,M1被定义为“全球首个开源的大规模混合架构推理模型”。

技术报告显示,M1模型在处理百万级Token的长文本上实现了重大突破,支持高达100万Token的上下文窗口,成为上下文最长的推理模型。此外,它还支持8万Token推理输出,为处理复杂文档分析、长篇代码生成等任务提供了可能性。

开源技术报告截图

MiniMax-M1的卓越性能,根植于其独特的架构设计和算法创新。其中,两大核心技术——线性注意力机制混合构架和更快的强化学习算法,构成了其高效能、低成本的基石。

分析人士认为,MiniMax此举不仅为开发者和企业提供了一个高性能、低门槛的新选择,也用事实证明了通过技术创新可以有效打破“算力-资本”的壁垒。这种“卷成本、卷效率”的竞争模式,将倒逼更多模型厂商走向真正的技术驱动和价值创造,而非停留在参数和估值的虚假繁荣中。

据了解,完整的M1模型权重、技术报告均已在Hugging Face和GitHub上开放获取。同时,公司正积极与国家超算平台、vLLM等业界主流开源框架合作,以确保开发者能够轻松、高效地部署和使用M1模型。

MiniMax相关负责人表示,M1的发布仅仅是MiniMax“开源周”的序幕。在接下来的四个工作日里,MiniMax计划每天发布一项新的技术或产品更新,持续为AI社区带来惊喜。

本站所有文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,结果仅供参考,今日霍州所有文章均包含本声明。

猜你喜欢