全双工语音通话大模型亮相 Soul App重塑人机互动新范式

当AI能够在交互中自主掌握互动节奏，“读”懂情绪，说得“人话”，人机互动体验会有怎样颠覆式的改变？在2025世界人工智能大会暨人工智能全球治理高级别会议（WAIC 2025）展览现场，社交平台Soul App呈现了技术能力建设和应用落地中AI社交的创新解决方案。

7月26日，WAIC 2025在上海隆重开幕。作为全球人工智能领域的顶级盛会，本届WAIC展览聚焦底层能力的演进与具体垂类场景的融合落地。坚持“模应一体”方向、立足“AI+社交”的具体场景，Soul App此次携最新升级的自研端到端全双工语音通话大模型亮相，展出该能力在多人语音互动场景群聊派对AI主持的应用交互效果，并立体呈现AI社区构建成果，展现AI重塑内容和交互后，更智能、真实、沉浸的情感支持和共鸣感受，重新定义AI社交范式。

Soul App CTO陶明表示，“在新质生产力深刻影响人类生活的当下，AI融入社交关系网络、重构交互方式已成为大势所趋。Soul致力于构建AI Being与Human Being共存的社交社区，以AI赋能链接、构建场景、提升体验，为用户带来幸福感和归属感。”

全双工音视频通话能力探索，实现真正“有温度”的人机交互

2025年，当技术积累逐渐成熟，“AI应用爆发”成为共识。在人工智能席卷各行业过程中，一个核心关注点在于，“AI+”为每个个体带来的具体价值是什么？

作为AI社交前沿探索者的代表，Soul在WAIC 2025展览中呈现了自身的思考，其展出的最新社交解决方案，也呈现了AI重塑社交的新方向。

在WAIC 2025现场，以“Soul的AI社交练习”为主题，平台重点展示全双工语音/视频通话能力支持下，“超类真人”和“深度沉浸”的社交体验，让AI在真实社交中扮演双重角色：贴心的Companion（情感疗愈伙伴），动态解析用户社交困境，提供个性化情绪赋能；高效的Connector（真人关系桥梁），AI Agent在真人用户间捕捉共鸣信号，催化真实友谊的萌芽。

此次，也是Soul自研的端到端全双工语音通话大模型正式亮相。不久前，Soul全双工语音通话大模型全面升级，重新定义“全双工”交互范式，摒弃了传统语音交互中依赖的 VAD（话音活性检测）机制与延迟控制逻辑，打破行业中普遍存在的“轮次对话”模式，赋予 AI 自主决策对话节奏的能力。

社交是情绪价值和信息价值的双向流动，让AI在交互中拥有“自主性”和“温度”，这将意味着人与AI之间能够实现真正双向的“社交”和“情感共生”，而非过去工具式的“轮次对话”，创新交互模式也吸引了现场众多观众的驻足体验。

据了解，全双工通话大模型即将在Soul平台内测，后续将陆续落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景。在WAIC现场，观众可以在数字装置上，率先体验到这一能力在Soul平台群聊派对AI主持的应用效果。

具体操作上，当用户进入多人语音互动场景中，AI主持人不仅具备全面管理群聊派对秩序的类真人主持的操作能力，还能够自然进行语音互动，有效活跃气氛、鼓励用户参与对话讨论，帮助用户流畅融入场景，显著提升群聊派对的参与度和体验感。

陶明介绍道，将全双工语音能力应用于多人互动场景，是加速AI融入社交关系网络、赋能真实社交、促进多元体验的关键一步。

值得注意的是，用户天然向往类现实“面对面”的交互感受，因此在赋予AI“自主性”外，多模态交互也是Soul探索的重要方向之一。此次活动现场，Soul也展示了关于全双工实时视频通话能力的最新探索成果，即基于全双工语音通话能力和实时视频生成能力，使用户可以看到“AI的形象和世界”，更多维、立体地塑造“数字人格”，促进关系的深度链接。此前，Soul团队实时人像视频生成研究成果已被国际学术顶会CVPR2025接收。

红星新闻记者郭晶晶