昆仑万维方汉：AI智能体的竞争，正从“会聊天”升级为“会干活”

最近，AI行业迎来一波密集的智能体落地潮。

字节跳动、阿里云、腾讯云等国内互联网公司先后发布企业级AI Agent平台，将智能体从技术概念推向真实业务场景；海外方面，头部厂商也在加速推进Agent能力的产品化部署。Claude上线“群聊Agent”功能，AI助手正式以“同事”身份进驻工作群。

密集的动作背后，信号已经足够清晰，AI智能体不再停留于对话，而是正在进入真实的工作流。

2026年被行业普遍视为“AI Agent元年”，行业的讨论焦点也从“模型有多聪明”转向“究竟能创造多少真实价值”。

智能体规模化落地提速之下，距离全面渗透各行各业的工作流还有多远？未来AI产业的核心竞争赛道将迎来怎样迭代？带着这些问题，我们对话昆仑万维董事长兼CEO方汉。

图片1.png

为什么还需要专门的“Agent模型”？

今年5月，昆仑万维天工AI全新推出智能体模型SkyClaw-v1.0，同时上线轻量化版本，兼顾企业专业工作和普通人日常使用。

什么是SkyClaw？简单来说，聊天AI是你问它答，SkyClaw是你说它做。

如今，DeepSeek、Claude、Qwen等通用模型已经足够强大，为什么行业里还需要专门的“Agent模型”？

对此，方汉用了一个很形象的比喻：“通用模型像百科全书，Agent模型更像熟练工。前者是知道得多，后者是干得稳。”在他看来，现在大多数通用大模型，本质上还是“问答模型”——用户输入问题，它输出答案。但真实工作场景并不是“一问一答”这么简单。

方汉提出了目前大模型普遍存在的问题，“很多模型在演示时看起来很厉害，但一放进真实生产环境就容易掉链子。因为它们训练时，并没有针对‘多轮任务+工具调用+超长上下文’这种复杂场景进行优化。”

SkyClaw-v1.0重点解决的，正是这些问题。

首先是“长记忆”。很多模型聊天一长，就容易“忘记前面说过什么”。而SkyClaw支持百万token上下文，可以理解超长内容。方汉打了个比方：“相当于它能一次读完《三体》三部曲，还记得里面每个细节。”

其次，是复杂工具调用能力。真实业务里，一个任务往往需要同时调用十几个工具，还可能出现异常、报错、信息缺失等情况。而SkyClaw需要做的不只是“给建议”，而是真正把任务推进下去。

三是持续执行能力。SkyClaw可以运行在OpenClaw、Hermes、Codex等主流Agent框架中，适配多种，真正做到“放进环境里就能持续干活”。

图片2.png

从“回答问题”到“承担完整工作流”，智能体改变了什么？

为了让普通人更容易理解智能体的变化，方汉举了一个开发者场景。

过去，如果一个程序员想写一个网页爬虫，他需要：问AI写代码、复制代码、本地运行、报错、再把错误贴回AI、AI修改、再运行，来来回回折腾很多次。

而现在，使用SkyClaw后，开发者只需要说一句话：“帮我抓取某网站新闻标题和发布日期，存进数据库，再生成一个Markdown表格。”

接下来，这个AI助理便会自动完成整个流程，整个过程不需要开发者手动复制、粘贴、调试，模型自己完成多轮迭代。

在方汉看来，真正高效的人机协作正是如此——模型负责执行，人负责判断和创造。但这并不意味着程序员会失业，而是可以从大量重复劳动中解放出来，把精力放在更复杂、更有创造性的事情上。

方汉补充道，这个逻辑同样适用于短剧平台：以前剪一万条广告素材要十几个人干一天，现在把一部短剧丢给Agent，它几个小时内就能自主完成分镜、判断精彩片段、自动剪辑、加字幕、出素材一系列操作。

此前，昆仑万维发布了“4+3”战略——四大SOTA模型（视频、音乐音频、世界模型、文本多模态）支撑三大AI原生平台（AI短剧、AI音乐、AI游戏）。方汉将四大SOTA模型比作不同工种，有的负责画画、有的负责写曲、有的负责生成游戏场景。但如果想完成一个复杂任务，就需要一个“项目经理”来协调所有流程。

如今，SkyClaw正是这个“项目经理”。它负责理解用户需求、拆解任务、调用不同模型、处理结果，并持续调整，直到最终交付完整内容。

方汉说：“专业模型负责‘会做某件事’，Agent模型负责‘把事情做完’。”他强调，智能体并不是替代其他模型，而是让整个AI系统真正协同起来。

未来每人都有"数字员工团队"

今年以来，“一人公司”成为创业领域热词，越来越多的“一人公司”正在生长。

什么叫一人公司？就是一个人，借助一组Agent，完成过去需要一个团队才能完成的工作。一个独立开发者，过去要自己写代码、做设计、写文案、做推广、处理客服。但未来，这些环节都可能由不同Agent完成。人真正需要做的，只剩下：定义目标、设计流程、做关键决策。

“高性能、低成本Agent模型，正是在加速这个进程。”方汉指出，高性能意味着它能处理复杂任务，而不只是在简单场景里“玩具式”地运行；低成本意味着规模化调用在经济上可行。

方汉预测，未来3年，一个普通知识工作者每天会与少则十几个、多则几十个Agent协作。它们不一定都以“对话机器人”形态出现，更多会在后台静默工作：例如，邮件Agent自动筛选分类并草拟回复，日程Agent自动协调会议时间，数据分析Agent每天早上下载最新报表并生成摘要，知识管理Agent自动整理读过的文章和笔记并在需要时精准检索。“你甚至感觉不到它们的存在，但你的工作效率会提升一个数量级。”

国家战略升级加速场景落地

2026年，政府工作报告首次提出“打造智能经济新形态”，并提出深化拓展“人工智能+”，促进新一代智能终端和智能体加快推广，推动重点行业领域人工智能商业化规模化应用，培育智能原生新业态新模式。2026年4月，工业和信息化部办公厅、国家数据局综合司联合印发《关于联合实施2026年“模数共振”行动的通知》，正式启动“模数共振”行动，推动人工智能模型与数据资源协同互促，助力人工智能高水平赋能新型工业化发展。

方汉认为，这对整个行业最大的意义，在于“场景开放速度会明显加快”。过去，AI智能体进入政务、金融、工业、科研等领域，最大的难点并不完全是技术，而是信任成本和系统接入成本。而当“智能体”进入国家战略后，很多行业的采购决策链会明显缩短。“大家会更愿意尝试，也更愿意开放真实场景。”方汉说道。

目前，昆仑万维正在推进两件事：一是通过免费试用，加速开发者生态建立；二是持续适配Claude Code、Codex、Hermes等主流Agent框架。

在方汉看来，未来真正的竞争，不再只是“谁的模型更会聊天”，而是谁能真正进入工作流、完成真实任务。

而谈及对未来 AI 产品模式的探索方向，方汉表示，他最期待的是“AI原生平台经济”方向。他解释道，过去的内容平台是“人创作、AI推荐”，未来将是“AI辅助创作、AI辅助分发、AI辅助变现”，创作者只需提供创意和判断。这一点目前已经在AI短剧和AI音乐平台上看到了雏形，一个不会剪辑的人，通过AI即可生成完整短剧，从拍摄、配乐到发布。

未来，昆仑万维将在三个方面持续突破，一是让三大AI原生平台全面Agent化，让人从“操作软件”变成“指挥Agent”；二是将Skywork打造成“个人超级智能体操作系统”，统一管理邮件、日程、代码、笔记、文档等数字工作；三是探索“智能体市场”，开发者可基于SkyClaw构建各种专业Agent，用户按需订阅，形成繁荣生态。

方汉用一句话勾勒出智能体时代的图景：“未来，每个人都会拥有由几十个Agent组成的‘数字员工团队’。AI不再是工具，而是真正的协作者。”

熊英英周琳佳红星新闻记者李伟铭