近日,在2025世界人工智能大会期间,后摩智能发布新一代端边大模型AI芯片后摩漫界®M50,同步推出力擎™系列M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。
上证报今日霍州讯(记者 刘怡鹤)近日,在2025世界人工智能大会期间,后摩智能发布新一代端边大模型AI芯片后摩漫界®M50,同步推出力擎™系列M.2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵。
后摩智能创始人、CEO吴强接受记者采访表示,定位端边大模型计算,一定程度上避开了和巨头竞争高壁垒产品及已固化的市场,另一方面可以发挥后摩智能存算一体技术的优势,在新兴的AIPC、智能语音设备、具身智能等新兴赛道找到位置。
在端边大模型场景创造价值
在AI大模型变革浪潮下,与多个国产AI芯片独角兽主攻云端算力不同,后摩智能发力端边大模型推理市场。
具体来说,现阶段后摩智能的芯片面向三大场景:一是平板、PC等消费终端,这些产品是主要的大模型生产力工具;二是智能语音会议系统,语音交互天然适配大模型;三是运营商边缘计算,5G+AI已成确定性趋势。选择深耕这些方向,既是从场景出发,也是基于公司的资源和积累。这些方向的客户中,既有公司的投资人,也有早期客户,如中国移动、联想等。
吴强表示,端边计算的核心是功耗和成本双敏感,因此后摩智能的策略绝非卷低价,而是拼性价比。他相信,只要能为客户创造可感知的价值,就有人愿意买单,正如iPhone、华为高端手机价格不菲却供不应求,原因就在于价值显性。同理,后摩智能也正与合作伙伴一起,聚焦端边大模型挖掘客户真正认可的场景。
具身智能对于低时延、低功耗的要求,使端侧计算成为其标配。吴强认为,具身智能仍处于早期阶段,周期较长,单靠这一业务远不足以支撑公司盈利。但从用户的角度出发,吴强始终看好具身智能的未来,比如其在养老方面能发挥的巨大价值。“我愿意为这个新赛道提前布局,预埋火种。”他说。
转型发挥存算一体技术优势
端侧大模型并非后摩智能最早锚定的方向。成立于2025年的后摩智能最早切入智能驾驶赛道,但吴强坦言,从2023年上半年开始意识到,这条赛道的格局基本固化、新玩家难以进入。与此同时,市场一度不看好更高级别的智能驾驶,后摩智能的产品算力比较超前,且有冗余,与当时的市场匹配度不够。
随着AI大模型的兴起,转型成了后摩智能“痛苦”的选择。2024年初,后摩智能在上一代芯片的基础上调整,推出了通用的端边大模型AI芯片M30。后摩智能的投资者之一中国移动为其提供了应用场景,M30芯片支持60B大模型运行呈现出良好的效果。“这一尝试给了我们信心,我们发现存算一体技术和大模型具有契合度。”吴强说。
后摩智能是最早将存算一体技术产业化的芯片公司之一。这项技术通过把计算和存储单元集成在一起,让数据就近处理,解决传统芯片“数据传输慢、功耗高”的问题。
沿着存算一体技术路径,后摩智能致力于打造同时具备高算力、高带宽、低功耗性能的AI芯片。最新一代的M50芯片的物理算力为160TOPS@INT8、100TFLOPS@bFP16,搭配最大48GB内存与153.6 GB/s的超高带宽,典型功耗仅10W。相当于以手机快充的功率,M50芯片就能让PC、智能语音设备、机器人等智能移动终端高效运行1.5B到70B参数的本地大模型,实现了“高算力、低功耗、即插即用”。
面向未来,后摩智能已启动下一代DRAM-PIM技术研发,通过将计算单元直接嵌入DRAM阵列,使计算与存储的协同更加紧密高效,推动百亿参数大模型在终端设备实现普及,让PC、平板等日常设备拥有更强大的AI算力。