百度高说服力数字人再升级,基于文心大模型实现体验、内容、视觉、效果四大突破

百度高说服力数字人再升级,基于文心大模型实现体验、内容、视觉、效果四大突破

6月17日,在百度AI Day开放日上,百度官宣打造业界首个超头主播罗永浩数字人,并发布了高说服力数字人的四大技术突破。此前,罗永浩数字人直播首秀创下超1300万人次观看、GMV突破5500万元的行业新纪录,部分核心品类带货量反超真人直播。

新一代高说服力数字人 引领智能电商新篇章

百度副总裁、电商总经理平晓黎表示,今年 4 月百度发布的高说服力数字人已让数字人带入 3.0 时代,这是一个新的里程碑,标志着智能电商迈入新篇章,新一代高说服力数字人成为了一个像真人一样,形神音容高度协调、会思考决策、能协作完成特定任务的超级智能体。“百度的罗永浩数字人已达到媲美超头主播的体感效果,随着大模型与多模能力发展,数字人未来超越真人效果极具潜力 ”,她补充道。

在高说服力数字人的基础之上,百度电商慧播星再一次迭代,围绕慧播星首席体验官罗永浩,发布了业界首个超头主播的数字人,并实现了体验、内容、视觉、效果的四大突破,使得数字人带货能力媲美真人。首先是体验突破,通过复刻罗永浩跟朱萧木的丝滑配合,上线了业界首个双数字人互动『直播间』,给营销转化和C端体验,打开了新的想象空间;二是内容新突破,得益于文心4.5T的升级,通过深度训练,使数字人做到了“懂创作”,带货时塑品专业度更高,数字人可以“有个性”,甚至能“玩梗”,为数字人注入灵魂;三是视觉新突破,这次的罗永浩数字人直播,是业内首个多模态高度融合的数字人应用场景,实现了在直播实时环境下的超长演绎,做到了动作、表情、语调等贴合话术,且稳定可控;四是效果新突破,AI大脑基于『直播间』信号灵活控场,数字人可以主动邀评、高频互动,极大提升用户沉浸感;通过多智能体实时调度,在数字人『直播间』实现了和真人『直播间』一样的互动玩法,如抽奖、发福袋等;强大的运营场控能力、多样化营销手段,有效提升用户转化。

百度电商商业业务部负责人、数字人创新业务部负责人吴晨霞表示,为了支撑本次罗永浩数字人的突破,慧播星重磅升级了新版本,实现了剧本、动作、声音、脚本、问答、互动等维度的全方位升级。吴晨霞对罗永浩数字人的诞生过程进行了揭秘,通过罗永浩、朱萧木的海量数据训练生成数字人主播,同时结合商品特性与罗永浩人设量身定制直播剧本,实现了神形音容全模态高度统一,还原了罗永浩、朱萧木的惯性动作、表情等,做到如同真人一样自然。在此基础上,慧播星以大师级的创作能力,生成人物高光片段,复刻罗氏幽默,在直播中能够接梗、玩梗,使得数字人表现力有了真人般的魅力。此外,本次突破技术难题的双人剧本,实现了双数字人的默契配合,属于行业首创。最后,慧播星作为业界首家实现「AI大脑」多智能体调度的产品,实现了灵活场控,并支持一个数字人『直播间』上线多种玩法,有效提升了用户转化。罗永浩数字人首秀大捷,标志着慧播星产品力迈向全新阶段。

背后“黑科技”揭秘:多模协同的数字人技术

百度集团副总裁吴甜系统性地介绍了多模协同的数字人技术。百度研制的多模协同的数字人技术,基于文心 4.5T 实现了融合多模规划与深度思考的剧本生成,由剧本驱动数字人多模协同,实现动态决策的实时交互,使数字人的“神、形、音、容、话”达到高度统一。最终呈现出一个具备高表现力,内容吸引人,人-物-场可自由交互的超拟真数字人。

她介绍道,剧本生成技术包含台词生成、多模驱动和动态交互三部分。以罗永浩数字人剧本为例,基于文心大模型4.5 Turbo生成的剧本,充分展现了主播的个人特色,具备典型的罗氏幽默风格,并能够实现双人主播的内容协同,动态实现丰富的实时互动。通过文本自控的语音合成大模型,实现高复原的语音合成能力,再结合直播台词及发音人特征,合成风格恰当、自然流畅的声音。为解决罗永浩数字人直播双人声音配合的难点,百度采用对话上下文编码器,将对话历史输入和当前对话进行语音合成的统一推理计算,最终实现流畅、自然的双人对话效果。在数字人形象生成以及驱动方面,通过结合多模态视频理解、跨模态信号生成、视频生成等技术,克服了高可控交互,高精度、长时间一致性保持等难点,实现了高一致性超拟真罗永浩数字人长视频生成。

吴甜表示,百度在今年4月发布了最新的文心 4.5 Turbo和文心X1 Turbo,罗永浩数字人是基于文心大模型的最佳实践。百度在大模型技术的持续探索和创新,将为用户带来更优质的体验、为行业带来更具创新力的业务模式。

“AI +直播” 模式开启电商新想象 超头主播的数字人或将涌现

会上,平晓黎正式宣布,罗永浩将正式担任百度慧播星首席产品体验官,罗永浩在入驻百度优选进行真人直播带货外,其数字人也将不定期开播、常态化为用户带来更多福利。罗永浩的数字人作为新一代高说服力数字人的首秀,引发了用户侧的广泛讨论与行业热议,特别是用户的转化效果媲美真人,意味着用户对于数字人的接受度已经被验证。

随着百度电商与交个朋友战略持续落地,未来,罗永浩作为超头主播,也将发挥引领作用,吸引更多超头主播加入,共建慧播星数字人矩阵,中国直播电商的竞争或将迎来新变局。

此外,百度电商还推出两大计划:梦蝶计划将通过流量扶持,超头主播数字人打造、预算扶持,实现百度优选超头主播的数量倍增;繁星计划则将再次追加10万个慧播星数字人,投入1亿元数字人消费补贴、千万级别的运营扶持,帮助更多的普通人、中小企业开启数字人直播。

据罗永浩所属机构交个朋友代表、公司副总裁吴加录表示,百度的AI能力与交个朋友的直播运营经验和供应链资源实现了技术与场景的完美结合,这类“技术+IP”的协同模式也将为行业探索智能化转型提供实践样本。

特别声明:[百度高说服力数字人再升级,基于文心大模型实现体验、内容、视觉、效果四大突破] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

项目案例|东仙酒店应用鼎盛威客控系统解决方案

整体而言,鼎盛威客控系统以小度语音交互为核心的功能设计,始终围绕宾客的使用体验展开,通过系统层面的整合与优化,让语音控制从 “可用” 升级为 “好用”,既展现了智能化的便捷性,也通过细节处的关怀,让每位宾客…

项目案例|东仙酒店应用鼎盛威客控系统解决方案

免签后俄罗斯游客挤满黑河入境大厅 俄游客热衷“买买买”(持有俄罗斯签证可以免签去哪些国家)

9月15日,中国对俄罗斯持普通护照人员实行免签政策首日,黑河口岸迎来了首批俄罗斯游客。这些游客乘坐商船抵达黑河口岸只需5分钟,他们对东北菜如锅包肉情有独钟

免签后俄罗斯游客挤满黑河入境大厅 俄游客热衷“买买买”(持有俄罗斯签证可以免签去哪些国家)

不藏着掖着了!巴特勒西班牙晒照,JB4无码现身(不藏着掖着了什么意思)

NBA球星吉米·巴特勒在西班牙度假时,通过『社交媒体』首次无码曝光了他的新一代签名鞋JB4,此前一直打码的图片终于清晰呈现,瞬间引爆鞋迷和篮球圈的热议。 巴特勒在个人『社交媒体』账号上更新了一组照片,分享了他和朋…

不藏着掖着了!巴特勒西班牙晒照,JB4无码现身(不藏着掖着了什么意思)

放料阀行业内的技术创新趋势(放料阀型号大全)

主要体现在智能化、材料应用、结构设计方面,具体如下: 智能诊断与预测性维护:数字孪生技术的应用使故障预判准确率达到 92%,部分高端产品还将引入预测性维护、数字孪生等新技术,通过传感器和智能控制系统,实时…

放料阀行业内的技术创新趋势(放料阀型号大全)

『吴京』人设崩塌引众怒,假爱国标签被揭,昔日硬汉形象成笑柄(『吴京』 评价)

电影里的爱国情怀真是让人心潮澎湃,观众们都是激动得像打了鸡血,结果他一下子圈了不少粉丝。在网友眼里,他的形象越来越好,被赞得不要不要的,搞得他自己都像个真军人似的,干出了不少搞笑的事儿。 连『李连杰』都没法说动…

『吴京』人设崩塌引众怒,假爱国标签被揭,昔日硬汉形象成笑柄(『吴京』 评价)