当AI能够在交互中自主掌握互动节奏,“读”懂情绪,说得“人话”,人机互动体验会有怎样颠覆式的改变?在2025世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)展览现场,社交平台Soul App呈现了技术能力建设和应用落地中AI社交的创新解决方案。
7月26日,WAIC 2025在上海隆重开幕。作为全球人工智能领域的顶级盛会,本届WAIC展览聚焦底层能力的演进与具体垂类场景的融合落地。坚持“模应一体”方向、立足“AI+社交”的具体场景,Soul App此次携最新升级的自研端到端全双工语音通话大模型亮相,展出该能力在多人语音互动场景群聊派对AI主持的应用交互效果,并立体呈现AI社区构建成果,展现AI重塑内容和交互后,更智能、真实、沉浸的情感支持和共鸣感受,重新定义AI社交范式。
Soul App CTO陶明表示,“在新质生产力深刻影响人类生活的当下,AI融入社交关系网络、重构交互方式已成为大势所趋。Soul致力于构建AI Being与Human Being共存的社交社区,以AI赋能链接、构建场景、提升体验,为用户带来幸福感和归属感。”
全双工音视频通话能力探索,实现真正“有温度”的人机交互
2025年,当技术积累逐渐成熟,“AI应用爆发”成为共识。在人工智能席卷各行业过程中,一个核心关注点在于,“AI+”为每个个体带来的具体价值是什么?
作为AI社交前沿探索者的代表,Soul在WAIC 2025展览中呈现了自身的思考,其展出的最新社交解决方案,也呈现了AI重塑社交的新方向。
在WAIC 2025现场,以“Soul的AI社交练习”为主题,平台重点展示全双工语音/视频通话能力支持下,“超类真人”和“深度沉浸”的社交体验,让AI在真实社交中扮演双重角色:贴心的Companion(情感疗愈伙伴),动态解析用户社交困境,提供个性化情绪赋能;高效的Connector(真人关系桥梁),AI Agent在真人用户间捕捉共鸣信号,催化真实友谊的萌芽。
此次,也是Soul自研的端到端全双工语音通话大模型正式亮相。不久前,Soul全双工语音通话大模型全面升级,重新定义“全双工”交互范式,摒弃了传统语音交互中依赖的 VAD(话音活性检测)机制与延迟控制逻辑,打破行业中普遍存在的“轮次对话”模式,赋予 AI 自主决策对话节奏的能力。
社交是情绪价值和信息价值的双向流动,让AI在交互中拥有“自主性”和“温度”,这将意味着人与AI之间能够实现真正双向的“社交”和“情感共生”,而非过去工具式的“轮次对话”,创新交互模式也吸引了现场众多观众的驻足体验。
据了解,全双工通话大模型即将在Soul平台内测,后续将陆续落地于虚拟人实时通话、AI匹配等1V1、多对多互动场景。在WAIC现场,观众可以在数字装置上,率先体验到这一能力在Soul平台群聊派对AI主持的应用效果。
具体操作上,当用户进入多人语音互动场景中,AI主持人不仅具备全面管理群聊派对秩序的类真人主持的操作能力,还能够自然进行语音互动,有效活跃气氛、鼓励用户参与对话讨论,帮助用户流畅融入场景,显著提升群聊派对的参与度和体验感。
陶明介绍道,将全双工语音能力应用于多人互动场景,是加速AI融入社交关系网络、赋能真实社交、促进多元体验的关键一步。
值得注意的是,用户天然向往类现实“面对面”的交互感受,因此在赋予AI“自主性”外,多模态交互也是Soul探索的重要方向之一。此次活动现场,Soul也展示了关于全双工实时视频通话能力的最新探索成果,即基于全双工语音通话能力和实时视频生成能力,使用户可以看到“AI的形象和世界”,更多维、立体地塑造“数字人格”,促进关系的深度链接。此前,Soul团队实时人像视频生成研究成果已被国际学术顶会CVPR2025接收。
红星新闻记者 郭晶晶