Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型

Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型

2 月 3 日消息,Gitee AI 昨日宣布上线 DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四个较小尺寸的 DeepSeek 模型。更值得关注的是,本次上线的四个模型均部署在国产沐曦曦云 GPU 上

与全尺寸 DeepSeek 模型相比,较小尺寸的 DeepSeek 蒸馏版本模型更适合企业内部实施部署,可以降低落地成本

同时,这次 Deepseek R1 模型 + 沐曦曦云 GPU + Gitee AI 平台,更是实现了从芯片到平台,从算力到模型全国产研发

注:DeepSeek R1 是一款大型混合专家(MoE)模型,拥有 6710 亿个参数,支持 128000 个 Token 的大输入上下文长度。

本次部署在沐曦曦云 GPU 上的是四个 DeepSeek R1 蒸馏模型,号称以更小参数量的资源占用,实现了性能与大参数模型“旗鼓相当”。

目前 Gitee AI 上的 DeepSeek-R1-Distill 系列模型现已面向全体开发者免费使用

特别声明:[Gitee AI 联合沐曦首发全套 DeepSeek R1 千问蒸馏模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

中信银行申请一种安全外壳协议远程登录的安全加固方法及装置专利,增强安全外壳协议远程登录的安全性(中信银行申请一张信用卡,给两张)

金融界2025年8月1日消息,国家知识产权局信息显示,中信银行股份有限公司申请一项名为“一种安全外壳协议远程登录的安全加固方法及装置”的专利,公开号CN120415809A,申请日期为2025年04月。 专利…

中信银行申请一种安全外壳协议远程登录的安全加固方法及装置专利,增强安全外壳协议远程登录的安全性(中信银行申请一张信用卡,给两张)

敢露额头才是真底气!薇娅、宋佳、董洁露脑门美得更惊艳(露额头好不好)

薇娅的扎发造型,结合大光明露额头是真的很清爽,但她的发型有一些小巧思,比如额头两侧会有碎发修饰一下脸型,让脸型更小更流畅。 董洁的露额头发型其实挺适合普通人借鉴的,如果你的额头也是比较饱满的类型,可以和她一…

敢露额头才是真底气!薇娅、宋佳、董洁露脑门美得更惊艳(露额头好不好)

数理统计学什么,就业方向怎么样?(数理统计学什么课程)

软件技能早掌握:大二前熟练使用RPython和SQL业务思维培养:通过商业案例分析理解统计应用场景复合知识构建:辅修计算机金融市场营销等专业职业网络搭建:加入CDA校友社群获取内推机会"21世纪最性感…

数理统计学什么,就业方向怎么样?(数理统计学什么课程)

辉县生物质项目顺利投运,中裕智慧能源构建绿色能源合作新范式(辉县生物发电厂还有吗?)

近日,辉县中诚实达建材生物质项目顺利投运,这一由中裕智慧能源集团倾力打造的项目,不仅为当地能源结构优化注入新活力,更彰显了中裕智慧能源在生物质能源综合利用领域的领先优势与技术实力。未来,中裕智慧能源将继续秉持…

辉县生物质项目顺利投运,中裕智慧能源构建绿色能源合作新范式(辉县生物发电厂还有吗?)

老乡看过来空气能8800元全套到家实用又省钱(老乡看过来空气好的句子)

考虑到大家买的时候成本高的问题,他们推出了个挺实在的活动,6 匹的空气能主机,全套送到家只要 8800 元,而且还会送变频水泵、缓冲水箱、安全组件和膨胀罐,这些配件单买也得不少钱,现在一起送,确实能省不少事。…

老乡看过来空气能8800元全套到家实用又省钱(老乡看过来空气好的句子)