赛道Hyper | Soul推出全双工通话大模型(赛道spin)

作者:周源/华尔街见闻

在 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)展览现场,『社交平台』Soul App展示了其自研的全双工通话大模型。

该模型即将在Soul平台开启内测,后续计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景,是社交领域的一项新探索。

就眼下Soul的“虚拟人”应对用户互动场景的表现来看,已深具“真实感”,但这种互动目前仅限于文字形式。

此次推出自研全双工通话大模型,若能实现实时通话,则其智能性确然会有更大提升。

调整传统交互模式

传统语音交互长期依赖VAD(话音活性检测)机制与延迟控制逻辑,形成轮次对话模式。

这种模式的人机对话,呈现一问一答刻板节奏:用户发言结束后,AI才开始响应,中间存在明显延迟,影响了交互的自然性。

在很多时候,用户发言过程中会出现短暂停顿,这可能被系统误判为发言结束,导致AI过早介入,打断用户思路,交流显得过于生硬。

Soul自研的端到端全双工语音通话大模型,对这一传统模式做了调整:不再采用VAD机制,尝试通过算法让AI自主把控对话节奏。

在实际交互中,AI可实时监测对话动态,有能力做出主动打破沉默、适时打断用户、边听边说等操作。

比如,用户讲述事情时稍作停顿思考,AI能察觉并非发言结束,补充引导性话语推动话题;在多人交流场景中,AI能判断发言时机加入讨论,与用户发言相互交织,使对话更流畅,接近人与人面对面交流的状态。

在理论上,这种交互模式使AI从被动的回应者转变为主动的参与者,在一定程度上能提升人机对话的自然度。

为让AI在交互中更接近“真人”,Soul的全双工通话大模型构建了多维度感知体系,包括时间感知、环境感知、事件感知等。通过分析这些维度的信息,AI试图更好地理解用户意图和情感状态,给出贴合情境的回应。

从时间感知来看,AI会依据对话时间调整语言风格和话题。清晨可能以“早上好,新的一天有什么安排吗?”开启对话;深夜用户倾诉烦恼时,回应会更温柔,给予情感支持。

在环境感知上,模型能识别用户所处环境,嘈杂时适当提高音量保证清晰,安静时声音则更轻柔。

在事件感知方面,AI能结合讨论的事件给出针对性观点。用户分享工作中完成重要项目时,AI会表示祝贺并询问细节,增加对话的真实感。

此外,模型在口语化表达和音色复刻上做了优化:能模拟语气词、结巴、情绪起伏等日常口语特征,还可根据用户需求复刻特定音色。

还有情绪表达,AI的声音情绪会随对话推进变化,用户分享喜悦时语调上扬,用户情绪低落时声音低沉关切。

这些处理在一定程度上提升了AI交互的真实感,但距离完全模拟真人还有差距,仍有较大的提升空间。

事实上,在该大模型推出前,Soul虚拟人在1V1或在响应用户评论时的互动中,其表现也有较高的自然性和智能性。若Soul没有标注“虚拟人”标签,其应对内容已具有高度的“真人”感。

AI推升电子社交真实性

全双工通话大模型在Soul平台的多个应用场景中得以应用,在1V1和多对多互动场景中,会对用户的社交体验产生影响。

在虚拟人实时通话场景中,该模型有望让虚拟人与用户的交流更自然。

以往虚拟人对话较刻板,有了这一模型后,虚拟人可实时捕捉用户情绪和话语变化,调整回应方式和语气,提供更个性化的陪伴服务,使用户感受到更真实的情感反馈。

在AI匹配的1V1互动场景中,模型发挥了怎样的作用?比如能通过算法帮助用户筛选契合的聊天对象,提高社交匹配效率。

在交流过程中,模型分析双方对话内容和情绪,适时提供话题建议或引导:当匹配双方初次交流出现冷场,AI会抛出与双方兴趣相关的话题,如“听说你们都喜欢摄影,最近有拍到满意的作品吗?”打破僵局,让交流更顺畅。

在多人语音互动场景如群聊派对中,AI主持人具备相应功能:用户进入群聊派对后,AI主持人能管理群聊秩序,控制发言顺序、提醒文明交流,还能与用户语音互动。

当群内气氛沉闷时,发起如“大家最近有看什么好电影,分享一下吧?”的话题,吸引用户参与;新成员加入时,热情打招呼并引导相互认识,帮助新成员融入,在一定程度上可能提升群聊派对的参与度。

Soul全双工通话大模型的出现,为自身平台发展带来了新的方向,也为AI社交行业提供了参考案例。

这个模型展示了AI技术在社交领域的一种应用可能:即通过技术创新突破传统交互限制,实现更自然的社交体验。

随着该技术的推广应用,其他『社交平台』可能会增加AI技术研发投入,探索将AI技术融入社交场景,推动行业技术发展。比如提升对话流畅性,或在多维度感知方面深入研究,增强社交体验的沉浸感。

Soul的实践会吸引更多开发者关注AI社交领域,促使新的社交应用和服务出现。AI社交的发展会影响人们的社交方式和观念,打破地域、时间限制,让人们更便捷地结识不同地区的朋友,拓展社交圈。

随着AI在社交中作用渐显,人们对“社交”的定义可能发生变化,更注重与AI及其他用户的情感共鸣和信息交流。

Soul全双工通话大模型即将内测并应用,是AI社交领域的一次新尝试:凭借新的技术架构和应用场景,为用户带来新的社交体验,为行业发展提供思路。

特别声明:[赛道Hyper | Soul推出全双工通话大模型(赛道spin)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

镖人》孙艺洲版知世郎,离漫画里的乱世点灯人差了点魂(镖人pv)

知世郎是《镖人》的灵魂,是掀起乱世风暴的关键,漫画里,他的智慧、他的理想、他的悲悯,支撑起了整个故事的格局;可电影里,他成了一个触发剧情的NPC,一个用来推动“护镖”主线的工具人,连一句能体现他理想的完整台词…

《<strong>镖人</strong>》孙艺洲版知世郎,离漫画里的乱世点灯人差了点魂(镖人pv)

AI编程概念盘初活跃 普元信息涨超15%(ai编程入门)

早盘AI编程概念活跃, 普元信息涨超15%, 金现代涨超10%, 新炬网络、 卓易信息、众诚科技跟涨。消息面上,华为云码道(CodeArts)代码智能体公测版2月26日发布,覆盖代码生成等AI编程技术。…

AI编程概念盘初活跃 普元信息涨超15%(ai编程入门)

钢铁百科:60Mn钢板标准、特性、性能及用途介绍(60si2mn钢牌号的意义)

存在过热敏感性和回火脆性倾向:在热处理过程中需严格控制温度和时间,避免材料性能下降。 复合钢管内层材料:60Mn钢板可作为复合钢管的内层材料,经特定淬火回火工艺处理后,可获得高硬度耐磨层,提高钢管的使用寿命…

钢铁百科:60Mn钢板标准、特性、性能及用途介绍(60si2mn钢牌号的意义)

吉安LED路灯价格解析与选购指南(led灯路灯价格)

理解价格,实质上是理解一套由光效系统、结构组件、控制单元及长期维护成本构成的综合技术方案。1、LED路灯价格是光效系统、结构组件、智能控制与安装维护等多模块技术方案的综合体现,需进行全生命周期成本分析。 2…

吉安LED路灯价格解析与选购指南(led灯路灯价格)

九游游戏娱乐维纳斯璀璨假期迎新角色(九娱游戏礼包)

时隔八个月,《维纳斯璀璨假期:死或生Xtreme》终于迎来全新登岛角色——希实(CV:花宫初奈)。不同于此前登场的个性派女神,希实以优等生形象亮相,性格开朗温柔,对身边所有人都展现出细致关怀。 根据官方公开的…

九游游戏娱乐维纳斯璀璨假期迎新角色(九娱游戏礼包)