国产GPU“四小龙”:英伟达阴影下的生死突围
英伟达的霸权笼罩下,国产GPU厂商正奋力突围。 2024年,英伟达研发投入高达129亿美元(约合900亿人民币),其500万CUDA开发生态更是牢不可破的护城河。面对这两座大山,国产“四小龙”——摩尔线程、沐曦、壁仞科技和瀚博半导体——正上演着一场惊险刺激的“上市竞速赛”,试图打破英伟达近乎垄断的市场格局。 这场竞赛中,融资额已突破200亿,每一家的策略都各不相同,都反映着国产GPU在技术、市场及商业模式上的探索与挑战。
技术差距与战略抉择:各有千秋
技术差距是摆在所有国产厂商面前的严峻现实。英伟达即将量产的Blackwell架构GPU,采用3nm工艺和光追单元,单卡算力将突破20PFLOPS。而国产GPU最先进者,壁仞科技的BR104,仍停留在7nm工艺;摩尔线程的5nm计划也尚未公布具体时间表。
摩尔线程: 其战略在于兼容CUDA生态。创始人张建中曾任英伟达中国区老大,MTTS3000显卡能够直接运行英伟达CUDA程序,这极大降低了开发者迁移的成本。北京亦庄某智算中心已用其替换了30%的英伟达A800,用于运行千亿参数的gemini-1.5-flash-latest模型。然而,美国实体清单的制裁迫使其7nm流片转向中芯国际,无疑增加了成本和时间。 三年亏损50亿的现实也残酷地展现了其挑战。
沐曦股份: 专注于高性能计算领域。其曦云C系列显卡单卡算力可与英伟达A100媲美,上海超算中心利用500张该卡搭建的集群,在2024年全球超算大会上跑出1027TFLOPS的Linpack成绩。但招股书显示,其90%的收入依赖政府采购,市场化程度有待提高,累计亏损33亿也印证了其艰难的商业化之路。
壁仞科技: 选择“高性能 高功耗”的策略。其BR100芯片采用Chiplet设计,算力号称是英伟达H100的三倍,但功耗高达1200W,单颗售价超过10万元,主要供应国家实验室。 这种策略高风险高回报,能否顺利实现规模化量产和商业化应用,仍有待观察。
瀚博半导体: 这家成立仅6年的公司,选择“绑定场景巨头”的策略,避开与英伟达在算力上的直接竞争。 两位AMD华人技术领袖,CEO钱军和CTO张磊,为公司带来了强大的技术实力和产业资源。 他们手握两代自研7nm芯片,产品已打入快手、阿里云等巨头的业务场景。在青岛港的智慧调度中心,瀚博显卡驱动着2000路摄像头,实时识别集装箱编号,每天节电8000度;阿里云也采购了其2000张加速卡,用于双11商品推荐算法。 7月18日,瀚博半导体正式启动A股IPO辅导,估值达105亿,其“双核心全员持股”的股权架构也为其未来发展提供了稳定保障。 其第二代旗舰产品SG100,拥有1280个计算核心,浮点算力达40TFLOPS,相当于英伟达2022年旗舰A100的70%性能,已在江苏智慧工厂成功应用于数字孪生系统。
政策扶持与生态建设:任重道远
面对英伟达的巨大优势,中国政府正在积极扶持国产GPU产业。北京经开区对国产GPU采购提供30%补贴,上海临港新片区则为瀚博半导体提供7nm流片补贴,降低了研发成本。然而,生态建设仍是国产GPU厂商面临的巨大挑战。中关村某服务器厂商的测试报告显示,使用国产显卡运行gemini-1.5-flash-latest模型,调试时间平均增加47小时。 这突显了软件生态的完善对国产GPU发展的重要性。
结语:
国产GPU“四小龙”的崛起,是国家战略的体现,也是中国科技自立自强的象征。虽然面临着巨大的挑战,但它们在各自选择的道路上不断探索,为打破英伟达的垄断做出了积极努力。 未来的竞争将更加激烈,谁能最终脱颖而出,不仅取决于技术实力,更取决于商业模式的创新和生态的建设。 这场“上市竞速赛”的最终结果,不仅决定着几家公司的命运,更将深刻影响中国半导体产业的未来。
"