美国官方报告首次用“对手AI”定义中国大模型,一场关于科技主导权的暗斗正悄然升级。
9月30日,美国商务部国家标准与技术研究院发布了一份针对中国『DeepSeek』 AI模型的评估报告,这是美国政府首次系统性评估中国AI模型,并将『DeepSeek』等中国大模型明确定义为“对手AI”。
报告指出,『DeepSeek』在性能、成本、安全和审查方面均落后于美国模型,可能对用户和国家安全构成风险。
这一评估由『美国总统特朗普』的“AI行动计划”授权进行,涵盖了『DeepSeek』的三个模型与美国四个前沿模型的对比测试。
美国国家标准与技术研究院旗下的AI标准与创新中心专家评估了三个『DeepSeek』模型和四个美国模型,覆盖了19个领域的基准测试。
评估结果显示,
,尤其在软件工程和网络任务方面差距最为明显。
在具体性能表现上,
,显示出明显的技术优势。
这一差距在复杂任务处理上尤为突出,表明中国AI模型在高阶推理和能力方面仍有待提升。
在成本效率方面,评估结果出现了矛盾现象。美国报告指出,在13项性能基准测试中,
,却能提供相似性能。
然而,这一结论与中国市场的实际情况截然不同。2025年中美AI竞争力对比报告显示,
。
『DeepSeek』 R1的每百万token输入成本仅为0.55美元💵,输出成本为2.19美元💵,性价比达到美国模型的27倍。
这种数据矛盾反映出两国在成本计算和方法论上可能存在的差异,同时也
体显
了不同的发展路径。
美国报告特别强调了『DeepSeek』模型的安全风险。『DeepSeek』最安全的模型R1-0528被发现在“代理劫持攻击”面前更为脆弱。
与美国的前沿模型相比,
。攻击者可利用这一弱点发送钓鱼邮件、下载恶意软件或窃取用户凭证。
在常见的越狱攻击手法下,
,相比之下,美国参考模型仅有8%,安全性差距相当明显。
这些安全漏洞可能对应用开发者和消费者构成严重威胁,尤其是部署在关键业务场景时。
报告还强调,中国政府的审查系统直接内置在『DeepSeek』模型中。研究表明,
。
当使用中文提示时,R1-0528模型的准确率达到了25.7%。该模型重复不准确和误导性的中共宣传内容的频率是美国模型的四倍。
AI Business分析指出,这种审查层不是偶然的怪癖,而是结构性地嵌入其中,源于中国模型发布前必须满足的监管要求。
这种内置的审查机制可能限制模型在某些话题上的信息提供能力,影响其国际应用的可能性。
面对中国AI的快速发展,美国已开始通过立法手段应对。今年7月,美国两党议员提出《禁用对抗性人工智能法案》,旨在阻止联邦机构采购和使用中国等“外国对手”研发的AI技术。
法案核心内容包括
,禁止联邦机构使用已列入清单的AI系统。
一旦该法案成功获批颁布,
,对开放科研环境构成严峻挑战。
尽管目前该法案仅适用于联邦机构,但不能排除未来其适用范围扩大至商业领域的可能性。
尽管美国报告指出中国AI模型的诸多不足,但『DeepSeek』等中国模型正在推动全球使用中国模型的数量迅速增长。
在具体领域上,
,而美国模型在软件工程和安全应用方面领先。
这反映了两国不同的国家优先级,也预示着AI领域开始出现专业化分工,而非一国主导所有领域。
同时,
。『DeepSeek』通过更高效的推理架构和优化的『服务器』资源调度,有效降低了单次操作的能耗和硬件成本。
从市场表现来看,
,形成双雄争霸格局。中美AI竞争不是“零和博弈”,而是技术创新与生态协同的比拼。
美国在『芯片』技术、软件生态等领域仍具系统性优势,中国则凭借政策执行力与工程创新,在智能算力规模、绿色技术应用等领域实现局部突破。