4月27~30日,中国家电及消费电子博览会(AWE)在上海新国际博览中心召开。TCL以“用科技拓展生活维度(Expand Your Life)”为主题,携实业与科技两大主体,智能终端、半导体显示、新能源光伏三大核心产业及前沿技术成果参展。
“因为大模型的出现, 我们认为 AIoT 会进入 2.0 的时代,TCL 会非常积极地拥抱 AI 领域的大变量”,TCL 实业 CTO 孙力在展会技术交流采访中表示,对 TCL 来说,快速接入大模型并结合AIoT,对未来的语音识别和 AIGC 内容生成等To C场景有着重要意义。
“AIGC的内容生成能力是巨大的红利,并将在未来的产品布局过程中释放极大的生产力。”孙力认为,OpenAI的大语言模型GPT3.5就已经开始完成消费应用级的转变,如今的GPT4.0已经可以拓展多模态的能力,未来的文本、图像、视频理解能力在多模态领域也会有非常多的应用,下一阶段的大语言模型或可完成对视频的交互和生成。
以TCL 的优势产品智能电视为例,孙力表示,TCL智能电视与AIGC技术的融合,将利用大模型的能力升级语音交互的体验。目前,TCL电视端已经拥有了大量的语音使用者,每天都有大量人在使用语音助手搜电影、音乐、健身等应用。有了大模型之后,大模型会让之前的 Chatbot(聊天机器人)闲聊、多轮对话、搜索内容、个性化内容推荐以及互动影音方面的体验均得到大幅提升。
此外,孙力指出,虽然大模型的效果非常惊艳,但不能替代所有的人工智能的场景。大模型通过云端就会产生延迟,考虑到算力、运行速度等问题,类似于手机拍照等一类功能场景则需要传统的小模型。
“对 TCL来说,布局首先要契合场景。大模型有很多通识的支持,具体还得找到适用的场景,因为它不是无所不能的。”孙力认为, ChatGPT 爆火的背后,是整个业界对大模型研发的关注。相较于图像的识别、人脸识别等解决局部问题的小模型,大模型的出现带来了非常大的技术变量,因此很难直接应用于电视、手机等产品,通常都部署在云端。类似于OpenAI这样的公司在算力、科学家、云厂商等工程方面的投入是非常巨大的,不一定适用于所有企业。
“如果用GPT来做一个⽂档总结,它能表现得很出色;但要用GPT来解决前端语⾳噪⾳的问题,就显得不那么合适。”他强调,一定要找到⼤模型的能⼒边界,要结合每家公司不同的产品、服务和场景需求点来做出调整。
“人类是闭环,身体的各部位运作是相互协同。但是,大模型现在还只是属于坐而论道的情况。”孙力提出,一定要用大模型的“大脑”加上AIoT的“手脚”,理解和决策才能形成闭环,产品才能发挥互联感知的能力。
大模型的崛起对TCL 鸿鹄实验室来说也是非常重要的技术方向。目前,已经有大量的内部产品都通过鸿鹄实验室搭建的语音中控、云平台、数据平台,包括云端的Prompt Engineers的能力等对接大模型,赋能产品场景体验、内部企业效率提升等场景。
红星新闻记者 郭晶晶