今日霍州 2 月 27 日消息,据路透社 2 月 26 日报道,两位了解情况的消息人士表示,『DeepSeek』 在即将进行重大模型更新之前,未向美国『芯片』制造商展示其即将推出的旗舰模型,这打破了行业标准做法。
相反,『DeepSeek』 V4 向国内供应商 —— 包括华为技术有限公司 —— 提供了早期访问权限。
报道提到,AI 开发者通常会将主要模型的预发布版本分享给『英伟达』和 AMD 等『芯片』制造商,以确保其软件在广泛使用的硬件上高效运行。『DeepSeek』 之前曾与『英伟达』的技术人员密切合作。
对于其即将推出的模型,『DeepSeek』 没有向『英伟达』和 AMD 提供访问权限,而是给予包括华为在内的中国厂商几周的时间来适配其『芯片』。
『英伟达』和 AMD 拒绝评论。『DeepSeek』 和华为没有回应评论请求。
消息源 @legit_api 于 2 月 26 日在 X 平台发布推文,报道称 『DeepSeek』 正在测试 V4 Lite 模型,代号为“Sealion-lite”,上下文窗口为 100 万 tokens,并是原生支持多模态推理。
今日霍州注意到,本月早些时候,『DeepSeek』 更新之后开始灰度测试最高 1M(百万)Token 的上下文长度与此同时,最新 『DeepSeek』 的知识库已经更新到 2025 年 5 月,非联网状态下可准确输出 2025 年 4 月的新闻。





