昆仑万维方汉:AI智能体的竞争,正从“会聊天”升级为“会干活”

红星新闻 2026-07-01 16:56

最近,AI行业迎来一波密集的智能体落地潮。

字节跳动、阿里云、腾讯云等国内互联网公司先后发布企业级AI Agent平台,将智能体从技术概念推向真实业务场景;海外方面,头部厂商也在加速推进Agent能力的产品化部署。Claude上线“群聊Agent”功能,AI助手正式以“同事”身份进驻工作群。

密集的动作背后,信号已经足够清晰,AI智能体不再停留于对话,而是正在进入真实的工作流。

2026年被行业普遍视为“AI Agent元年”,行业的讨论焦点也从“模型有多聪明”转向“究竟能创造多少真实价值”。

智能体规模化落地提速之下,距离全面渗透各行各业的工作流还有多远?未来AI产业的核心竞争赛道将迎来怎样迭代?带着这些问题,我们对话昆仑万维董事长兼CEO方汉。

图片1.png

为什么还需要专门的“Agent模型”?

今年5月,昆仑万维天工AI全新推出智能体模型SkyClaw-v1.0,同时上线轻量化版本,兼顾企业专业工作和普通人日常使用。

什么是SkyClaw?简单来说,聊天AI是你问它答,SkyClaw是你说它做。

如今,DeepSeek、Claude、Qwen等通用模型已经足够强大,为什么行业里还需要专门的“Agent模型”?

对此,方汉用了一个很形象的比喻:“通用模型像百科全书,Agent模型更像熟练工。前者是知道得多,后者是干得稳。”在他看来,现在大多数通用大模型,本质上还是“问答模型”——用户输入问题,它输出答案。但真实工作场景并不是“一问一答”这么简单。

方汉提出了目前大模型普遍存在的问题,“很多模型在演示时看起来很厉害,但一放进真实生产环境就容易掉链子。因为它们训练时,并没有针对‘多轮任务+工具调用+超长上下文’这种复杂场景进行优化。”

SkyClaw-v1.0重点解决的,正是这些问题。

首先是“长记忆”。很多模型聊天一长,就容易“忘记前面说过什么”。而SkyClaw支持百万token上下文,可以理解超长内容。方汉打了个比方:“相当于它能一次读完《三体》三部曲,还记得里面每个细节。”

其次,是复杂工具调用能力。真实业务里,一个任务往往需要同时调用十几个工具,还可能出现异常、报错、信息缺失等情况。而SkyClaw需要做的不只是“给建议”,而是真正把任务推进下去。

三是持续执行能力。SkyClaw可以运行在OpenClaw、Hermes、Codex等主流Agent框架中,适配多种,真正做到“放进环境里就能持续干活”。

图片2.png

从“回答问题”到“承担完整工作流”,智能体改变了什么?

为了让普通人更容易理解智能体的变化,方汉举了一个开发者场景。

过去,如果一个程序员想写一个网页爬虫,他需要:问AI写代码、复制代码、本地运行、报错、再把错误贴回AI、AI修改、再运行,来来回回折腾很多次。

而现在,使用SkyClaw后,开发者只需要说一句话:“帮我抓取某网站新闻标题和发布日期,存进数据库,再生成一个Markdown表格。”

接下来,这个AI助理便会自动完成整个流程,整个过程不需要开发者手动复制、粘贴、调试,模型自己完成多轮迭代。

在方汉看来,真正高效的人机协作正是如此——模型负责执行,人负责判断和创造。但这并不意味着程序员会失业,而是可以从大量重复劳动中解放出来,把精力放在更复杂、更有创造性的事情上。

方汉补充道,这个逻辑同样适用于短剧平台:以前剪一万条广告素材要十几个人干一天,现在把一部短剧丢给Agent,它几个小时内就能自主完成分镜、判断精彩片段、自动剪辑、加字幕、出素材一系列操作。

此前,昆仑万维发布了“4+3”战略——四大SOTA模型(视频、音乐音频、世界模型、文本多模态)支撑三大AI原生平台(AI短剧、AI音乐、AI游戏)。方汉将四大SOTA模型比作不同工种,有的负责画画、有的负责写曲、有的负责生成游戏场景。但如果想完成一个复杂任务,就需要一个“项目经理”来协调所有流程。

如今,SkyClaw正是这个“项目经理”。它负责理解用户需求、拆解任务、调用不同模型、处理结果,并持续调整,直到最终交付完整内容。

方汉说:“专业模型负责‘会做某件事’,Agent模型负责‘把事情做完’。”他强调,智能体并不是替代其他模型,而是让整个AI系统真正协同起来。

未来每人都有"数字员工团队"

今年以来,“一人公司”成为创业领域热词,越来越多的“一人公司”正在生长。

什么叫一人公司?就是一个人,借助一组Agent,完成过去需要一个团队才能完成的工作。一个独立开发者,过去要自己写代码、做设计、写文案、做推广、处理客服。但未来,这些环节都可能由不同Agent完成。人真正需要做的,只剩下:定义目标、设计流程、做关键决策。

“高性能、低成本Agent模型,正是在加速这个进程。”方汉指出,高性能意味着它能处理复杂任务,而不只是在简单场景里“玩具式”地运行;低成本意味着规模化调用在经济上可行。

方汉预测,未来3年,一个普通知识工作者每天会与少则十几个、多则几十个Agent协作。它们不一定都以“对话机器人”形态出现,更多会在后台静默工作:例如,邮件Agent自动筛选分类并草拟回复,日程Agent自动协调会议时间,数据分析Agent每天早上下载最新报表并生成摘要,知识管理Agent自动整理读过的文章和笔记并在需要时精准检索。“你甚至感觉不到它们的存在,但你的工作效率会提升一个数量级。”

国家战略升级加速场景落地

2026年,政府工作报告首次提出“打造智能经济新形态”,并提出深化拓展“人工智能+”,促进新一代智能终端和智能体加快推广,推动重点行业领域人工智能商业化规模化应用,培育智能原生新业态新模式。2026年4月,工业和信息化部办公厅、国家数据局综合司联合印发《关于联合实施2026年“模数共振”行动的通知》,正式启动“模数共振”行动,推动人工智能模型与数据资源协同互促,助力人工智能高水平赋能新型工业化发展。

方汉认为,这对整个行业最大的意义,在于“场景开放速度会明显加快”。过去,AI智能体进入政务、金融、工业、科研等领域,最大的难点并不完全是技术,而是信任成本和系统接入成本。而当“智能体”进入国家战略后,很多行业的采购决策链会明显缩短。“大家会更愿意尝试,也更愿意开放真实场景。”方汉说道。

目前,昆仑万维正在推进两件事:一是通过免费试用,加速开发者生态建立;二是持续适配Claude Code、Codex、Hermes等主流Agent框架。

在方汉看来,未来真正的竞争,不再只是“谁的模型更会聊天”,而是谁能真正进入工作流、完成真实任务。

而谈及对未来 AI 产品模式的探索方向,方汉表示,他最期待的是“AI原生平台经济”方向。他解释道,过去的内容平台是“人创作、AI推荐”,未来将是“AI辅助创作、AI辅助分发、AI辅助变现”,创作者只需提供创意和判断。这一点目前已经在AI短剧和AI音乐平台上看到了雏形,一个不会剪辑的人,通过AI即可生成完整短剧,从拍摄、配乐到发布。

未来,昆仑万维将在三个方面持续突破,一是让三大AI原生平台全面Agent化,让人从“操作软件”变成“指挥Agent”;二是将Skywork打造成“个人超级智能体操作系统”,统一管理邮件、日程、代码、笔记、文档等数字工作;三是探索“智能体市场”,开发者可基于SkyClaw构建各种专业Agent,用户按需订阅,形成繁荣生态。

方汉用一句话勾勒出智能体时代的图景:“未来,每个人都会拥有由几十个Agent组成的‘数字员工团队’。AI不再是工具,而是真正的协作者。”

熊英英 周琳佳 红星新闻记者 李伟铭