这两天,AI界最大的热点莫过于2025年世界人工智能大会(以下简称WAIC),三大展馆、超800家企业、100余款“全球首发”“中国首秀”的重磅新品集体亮相,规模可谓创历届之最。
而当我们走进今年的WAIC,一些新的迹象着实让人感到眼前一亮。
比如“下沉产业”成为各大参展厂商和观展人口中的一个关键词,再比如,无论是大模型领域、具身智能领域,还是智能硬件领域,各领域企业的战略和产品几乎都在向场景落地的方向侧重,致力于破解生产、生活、公共服务中的实际难题。
这些迹象其实也透露出AI行业的一个重大转变,即AI技术的发展已经过了概念验证期,进入到了一个技术应用期,一个规模化应用的新阶段。
不得不说的是,在一众参展企业中,最强调把AI用起来的还要属百度。
作为中国科技企业中的技术引领者,多年来百度AI所贯彻的“超级有用”理念的确是一个值得关注与研究的范本,接下来我们就以百度为案例,对AI的下一个发展阶段为何必然走向“超级有用”做一个深度剖析。
作 者:正风
来 源:正和岛(ID:zhenghedao)
我们先从百度在本届WAIC上的亮眼表现说起,在这场中国AI领域最重要的盛会上,百度展现出了在人工智能领域无可争议的领先实力。
例如,其三大AI核心技术产品——萝卜快跑(无人驾驶)、飞桨深度学习平台(框架)、百度智算集群(算力)均入选了中国人工智能产业创新成果展。同时,百度还发布了新一代数字人技术NOVA,从其呈现出的能力来看,或将深刻改写中国直播电商的格局。
进一步观察下来,我们认为,百度此次携一众技术成果亮相WAIC的背后,有两点极为关注的信号:
第一,这代表着国家层面对百度的认可与肯定,官方的背书再次印证了百度的技术实力及其产品的稳定与可靠。
例如,在本届WAIC上,百度等一批科技企业获得了上海智能网联汽车示范运营牌照,这标志着萝卜快跑在上海的落地进入到一个新阶段。此外,萝卜快跑还是本届⼤会官方指定的接驳车,这一身份的含金量也不言而喻。
多说一句,大洋彼岸的Waymo近期在无人驾驶出租车服务领域也是动作不断,前不久重启了在纽约市的道路测试,目前正寻求在纽约获得自动驾驶出租车测试许可,行业老玩家特斯拉最近也正式启动无人驾驶出租车服务。由此可见,全球无人驾驶出租车领域即将进入爆发前夜。
第二,从百度发布的产品和技术上来看,也透露出了一个十分明显的迹象,那就是在AI的发展上,百度坚定地秉持“超级有用”理念,而非单纯的炫技或秀参数。
这一点也很好理解,比如萝卜快跑,彻底革新了人们的出行方式。还有此次大会上重磅推出的数字人技术NOVA,让数字人能够媲美乃至超越真人主播,让一个流畅、自然、可互动的数字人直播成为现实。
由此不难发现,百度的AI理念不是一味强调参数有多高,技术性能有多强大,而是真正把AI用起来,让AI“超级好用”,进而给用户、行业、社会带来切实的改变。
当然,这背后的基础是百度这些年来在底层AI技术上的投入和努力。比如全栈自研的Apollo自动驾驶系统、自主研发且不断进化的文心大模型、中国首个产业级深度学习平台飞桨等等,这些技术上的领先奠定了其AI应用上的繁荣。
从更深层的视角来看,我们认为,百度目前走的这条“超级有用”之路,于当下的AI界而言其实也有着重要的思考与学习价值,乃至称得上是一条AI发展的必经之路。
为什么这么说?接下来,我们就以萝卜快跑与NOVA为例做一个详解。
这轮亮相,很是亮眼!
先来聊聊这届WAIC上吸睛无数的接驳车萝卜快跑。
最近这一年,萝卜快跑可谓消息不断,从中也能感受到一个明显的迹象,即萝卜快跑的版图和应用正在加速扩张与落地。
具体来看:
去年底萝卜快跑获批香港首个自动驾驶车辆先导牌照,成为全球唯一一个既能在左舵出行市场落地,又能在右舵左行市场落地的自动驾驶公司;
今年3月,萝卜快跑与迪拜道路交通局(RTA)签署战略合作协议,在迪拜市区开展无人驾驶规模化测试和服务,并宣布与阿联酋自动驾驶出行公司Autogo共同打造阿布扎比地区规模最大的无人车队;
7月,萝卜快跑又与全球最⼤的移动出行服务平台Uber建立战略合作伙伴关系。在外界看来,这既是中国技术对外输出的一大里程碑,同时也意味着中国自动驾驶技术出海的历史性突破。
再结合此次WAIC上萝卜快跑获得上海智能网联汽车示范运营牌照的消息,以及为全球用户提供超千万次的服务数据来看,可以说,在自动驾驶领域,萝卜快跑已经实现了规模化的落地和部署,且其出海方式也已从技术输出转向与海外监管部门和科技公司的深度合作。
显然,在出海的进程与形式上,萝卜快跑既跑出了新的加速度,同时也为中国科技企业出海提供了一个全新范式。
再来看WAIC上的另一个重头戏NOVA。
7月26日,百度在WAIC上正式发布了新一代数字人技术NOVA,但这一技术其实在今年“618”期间已经在罗永浩直播间进行了应用,并得到了良好的数据验证。
当天,罗永浩数字人在百度电商完成了首场直播,6个多小时里,直播间吸引了超1300万人次观看,GMV更是突破5500万元,一度创下数字人直播带货新纪录,最重要的是,如果不告诉观众,大家几乎不会知道直播间里的竟是AI老罗。
NOVA能够如此仿真的背后,还要归功于文心大模型4.5Turbo的大师级剧本模式,它能够生成优质脚本并驱动多模态协同,让数字人可以根据商品信息、参考知识以及人设要求等,实时调整主播的语调、表情和动作。此外,其搭载的AI大脑还可以实时接收直播数据并进行自主决策,让数字人真正听得懂包袱、开得了玩笑、答得了问题。
目前来看,NOVA所具备的这种思考与协同能力可以说一举打破了外界对于数字人“无情的念稿机器”的固有认知,这样一个媲美乃至超越真人的数字人主播,接下来很可能也会催生出新的内容生产范式,每一个普通人在NOVA技术的加持下,也有望和大主播一样成为带货达人。
从更宏观的视角来看,无论是自动驾驶技术还是数字人技术,百度重点投入的这几大领域,其实也正是这轮全球科技竞争中的焦点所在,用“兵家必争之地”来形容也并不为过。
比如自动驾驶,毫无疑问是当下最热门的赛道之一。高盛发布的报告显示,到2030年全球Robotaxi市场规模有望达到400亿至457亿美元,复合年增长率超过60%。目前,整个行业也已呈现出萝卜快跑、谷歌旗下的Waymo以及特斯拉的三足鼎立之势。
数字人技术也是一样,这几年来,Epic Games、英伟达、Meta等美国科技企业先后推出各自的数字人创作工具、平台或技术,行业发展方向从泛娱乐领域向教育、金融、医疗等服务型场景延伸,几大玩家之间的竞争也是愈演愈烈。
由此可见,百度扎根的这几大领域其实也是全球科技玩家们争相下注的,是大家公认有着广阔前景的,是契合这个时代AI发展的大方向的。
这个大方向是什么?用一句话来形容,就是超脱于泛娱乐层面,让AI技术真正为人所用,给人的生活及千行百业带来向上、向善的改变。
再简单点来说,就是要让AI变得“超级有用”,而这也正是百度AI的一个核心理念。
有用、有用、超级有用
这里,先和大家分享一个耳熟能详却又略显陌生的故事。
我们都知道瓦特改良蒸汽机的故事,不过瓦特早期改良的蒸汽机并不是用在火车、轮船和工厂中,而是用在矿山抽水中。真正把蒸汽机推向市场,大规模应用在交通工具和生产部门的其实另有其人,这个人就是英国制造商和工程师博尔顿。
当时,博尔顿建议瓦特把蒸汽泵的上下运动改为旋转运动,以拓展用途,并愿意为此提供资金。在博尔顿的支持下,瓦特发明了行星齿轮装置,改良了蒸汽机,并大获成功,蒸汽机也因此成为了第一次工业革命时期的主要动力。
尽管博尔顿不是瓦特这样的大发明家,但是他敏锐地看到了蒸汽机的巨大潜力,并提出一系列修改建议,使之成功推向市场,让蒸汽机技术走进了大众生活,彻底颠覆了人们过往的出行和生产方式。
所以,蒸汽机虽然不是博尔顿发明的,但他把蒸汽机技术推向实际应用领域和全社会的行为同样无比重要。说得直接点,科技成果的价值很大程度上就在于应用,无论多么有建树的新技术、新成果,发明创造之后如果束之高阁,就没有多大的实际意义。
结合如今AI领域的动向来看,可以发现,百度这些年在AI领域的一系列动作其实与博尔顿的做法有些类似。百度所做的事,很大一部分就是把AI技术真正用起来,用到一个又一个实际场景中,百度所相信的,是技术的力量在于解决问题,而非功能的堆砌。
一切,也正如李彦宏所言:“百度不是要推出一个‘超级应用’,而是要打造数百万级‘超级有用’的应用。”
回顾下来,这些年来,百度也的确通过一个又一个好用实用的AI应用证明了其对“超级有用”理念的贯彻。
这方面,除了我们前文提到的萝卜快跑和NOVA外,相关的例子还有很多很多:
比如“一站式AI内容获取和创作平台”百度文库,凭借全场景指令编辑等上百项行业领先的跨模态AI功能,大大降低了普通用户在漫画、小说和PPT等领域的创作门槛;
比如百舸GPU云平台,其独创的“训推一体化”架构,可以实现模型训练与推理的无缝切换,让资源利用率大幅度提升。在集群创建、开发实验、模型训练、模型推理四大方面,为企业提供“多快稳省”的AI基础设施,在万卡集群的建设中也发挥着至关重要的作用;
再比如开源开放的产业级深度学习平台飞桨,集深度学习核心训练和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,系统性地解决了大模型产业面临的训练成本高、推理效率低、硬件适配难等核心痛点,广泛赋能于交通、金融、工业、农业等关键行业的智能化转型升级。
显然,百度AI所做的一切,是为了赋能广大用户与千行百业,推动AI的普及与落地,让这个世界真正享受到AI带来的机遇、便利和无限可能。
历时十余年,耗资千余亿
用技术支撑起“有用”的底气
还有一个必须要提的点是,百度AI“超级有用”的理念之所以能够提出并践行下来,背后最大的底气一定是这些年来百度在AI领域的投入与努力。或者说,这份技术支撑,正是其应用得以大规模落地的根基所在。
这一点,我们同样可以从一个故事中得到更深的体会。
2012年秋天,加拿大多伦多大学计算机科学名誉教授,后来的图灵奖获得者、诺贝尔物理学奖获得者、“AI之父”杰弗里·辛顿和学生们发表了一篇长约9页的论文:《基于深层卷积神经网络的ImageNet分类》,提出了一种全新的深层结构分析方法。
他们用这种方法大幅降低了图像识别的错误率,在当年ImageNet图像识别大赛中一鸣惊人,也让大家对深度神经网络刮目相看。
今天回过头去看,这绝对算得上是AI技术发展的一个历史性时刻,神经网络或者说深度学习,由此从一条潜流,正式汇入学术和产业界的主流长河。而百度正是最早发现辛顿这篇论文价值的科技公司。
这篇论文发布不久后,百度便随即着手与辛顿取得联系,询问他们是否需要帮助,百度愿意提供充足的研究经费。之后,百度又向辛顿抛出橄榄枝,表示愿意以1200万美元的价格,邀请他和团队加盟百度。
百度的这一动作很快吸引了另外两家科技巨头的注意,紧随其后,谷歌和微软也相继向辛顿发出了邀约。由此,一场企业邀约逐渐变成了一场商业竞拍,一周多时间里,百度、微软和DeepMind等公司纷纷派了各自代表与辛顿展开洽谈,希望能邀请到他的加盟。
尽管处于出于不想高龄远渡重洋等种种原因,辛顿最终决定加入了谷歌,但通过这一事件不难看出,李彦宏早在十年前就已经展露出了对AI的重视、热枕与信仰,此后他那份坚定拥抱AI的决心更是彰显无疑。
具体来看,2012年之后,百度在对AI的探索与应用上可谓一路狂奔,且从未偏离AI这一新的主航道:
2013年,百度在硅谷成立百度美国研究院,同年,百度在中国建立深度学习研究院,李彦宏亲自任院长;
2015-2016年,百度进入AI技术产品化和商业化阶段,陆续推出人工智能语音助手度秘(DuerOS)和瞄准无人驾驶的Apollo计划;
2019年,百度文心大模型发布,它可以根据用户的描述生成文章、画作、图表、视频等多种内容,也就是如今的“生成式AI”。
2022年,百度又发布了“知一跨模态大模型”。可以理解文本、图片、视频等形态各异的数据。
……
如果从2013年建立美国研究院,正式投入对AI的研究算起,这十余年的时间里,百度在AI底层技术研究上的投入早已超过千亿,其在AI技术上呈现出一种典型的长周期、马拉松式的投入,这场跨越十年的“长跑”,构建起了如今百度AI“超级有用”的技术底牌。
且必须要说的是,凭借十年磨一剑的毅力,凭借长周期高强度投入,百度无疑是中国AI领域的技术派担当。在云计算、大模型以及自动驾驶等AI技术的进步、推广与应用上,其努力与付出需要被看见和重视,其创新与成果也值得被肯定和点赞。
想来,这一切也正应了那句,“你做三四月的事,在八九月自有答案。”
结语
“现代管理学之父”德鲁克有一句名言,被认为“商业之美”最好的形容:“世界上之所以出现鞋匠,不是因为鞋匠需要钱,而是因为人们需要鞋。”
技术的演进亦是如此,无论AI技术多么炫目迷人,其终极意义,终究要回归到为人所用,解决真实世界的痛点,驱动社会与产业的向上发展。
在本届WAIC上,我们欣慰地看到,一众AI企业已经对这份“商业之美”做出了回应。例如,展厅有能叠衣服、写字、煮串的机器人,有能精准提示演讲内容的AI眼镜,还有能够像真人医生一样给出诊断建议的“AI医生”等等。
一个又一个可落地、可感知的应用,既印证了百度“超级有用”理念的前瞻性和预见性,更揭示出:“超级有用”并非仅仅是百度的选择,也是AI技术走向成熟、释放最大潜能的必经之路。
祝福百度,时间终将证明“超级有用”重要价值与深远意义。
排版 | 小禾编辑 | 正风 主编 | 孙允广