『DeepSeek』-V3.2-Exp模型正式在Hugging Face平台发布并开源。模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型推理效率。
『DeepSeek』宣布官方App、网页端、小程序均已同步更新为『DeepSeek』-V3.2-Exp。『DeepSeek』介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用『DeepSeek』 API的成本将降低50%以上。
『DeepSeek』-V3.2发布当天寒武纪与昇腾均已实现适配,业内人士指出,『DeepSeek』-V3.2最大的意义在于软硬协同设计支持国产算力,全新『DeepSeek』 Sparse Attention机制,叠加国产『芯片』的计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。day 0适配和优化彰显了国产『芯片』的生态建设和技术积累成果,『芯片』和算法的联合创新,软硬件协同方式将进一步加速国内AI产业发展。
据财联社主题库显示,相关上市公司中: