在蛇年新春之际,人工智能领域传来了一则令人瞩目的消息:中国的『DeepSeek』公司正以其独特的人工智能解决方案在全球舞台上崭露头角。该公司自豪地宣称,其人工智能模型相较于美国同行,展现出了更为显著的成本效益,这一优势使得『DeepSeek』应用程序在51个国家中大受欢迎。
『DeepSeek』的成功背后,离不开华为Ascend 910C『芯片』的鼎力支持。据悉,『DeepSeek』的『大语言模型』『DeepSeek』 R1在训练阶段采用了『英伟达』的H100 GPU,但在推理环节——即生成人工智能响应的过程中——则转而依赖华为的Ascend 910C『芯片』。这一策略不仅大幅降低了成本,还有效减少了对美国技术的依赖。
『DeepSeek』相较于Open AI的成本优势尤为明显。『DeepSeek』 R1的预训练费用仅为557.6万美元💵,使用2048块『英伟达』H800 GPU集群运行55天即可完成。而在API调用成本方面,『DeepSeek』 R1更是以每百万输入tokens仅需0.55美元💵的价格,远低于OpenAI-o1模型的15美元💵。『DeepSeek』 R1还支持在本地消费硬件上运行精简版本,从而完全避免了云费用的支出。
人工智能研究员Dorialexander指出,Ascend 910C『芯片』主要用于推理而非训练。训练人工智能模型需要强大的计算能力,而这正是『英伟达』GPU所擅长的。相比之下,推理过程所需的功率较少,使得华为的Ascend 910C『芯片』成为了一个可行的替代方案。这种结合使用不同『芯片』的策略,既保持了高性能,又实现了成本节约。
然而,Ascend 910C『芯片』并非没有局限性。它缺乏训练大规模人工智能模型所需的能力,因此中国的人工智能公司在模型开发方面仍然依赖『英伟达』。为了克服这一挑战,华为正在积极研发Ascend 920C『芯片』,旨在与『英伟达』的顶级人工智能『芯片』Blackwell B200一较高下。如果研发成功,这将为中国企业提供一个强大的国产选择。
『DeepSeek』 R1的开源性质和低成本策略使其在发布后迅速获得了广泛关注。其开源代码和训练方法不仅为开发者提供了极大的灵活性,还有助于推动AI技术的普及与创新。这一举措无疑将进一步加速人工智能技术的发展和应用。
『DeepSeek』的崛起不仅展示了中国在人工智能领域的雄心壮志,还预示着整个行业可能迎来的变革。其成本效益战略和华为在硬件方面的不断进步,可能会对整个行业产生深远影响。中美科技巨头在人工智能领域的较量,无疑将决定这一技术的未来走向。这种竞争将推动未来几年内的创新、降低成本并提升全球影响力。
对于关注人工智能发展的读者来说,『DeepSeek』的故事无疑是一个值得期待的精彩篇章。让我们共同期待这一领域未来更多的惊喜和突破吧!