2024年,AI Agent 成了圈内最热的名词。几乎所有AI公司都在谈 Agent,所有大模型都在集成 Agent,所有开发者都在尝试“做一个自己的 Agent”。
问题是,大家说的 Agent,真的能用起来了吗?
最近,字节跳动的“扣子空间”内测亮相,让我第一次看到国内团队对 Agent 的严肃思考。不是那种“给大模型套个壳、拼个工具链”的简单组装,而是一套真正以“完成任务”为目标、面向产品交付的 AI 工作系统。
如果你对“AI 不止是聊天,而是要干活”这件事感兴趣,建议你读完这篇文章。
一、AI Agent 的困境:模型强了,体验却退步了
ChatGPT 把大模型送上了C位,然而也制造了一个行业错觉:只要模型够强,一切问题都能解决。
但现实是,大模型升级了,用户体验反而没有同步跟上:
-
复杂任务,模型靠“一次问答”很难搞定
-
用户很难知道自己该怎么提问
-
多轮交互后,模型常常“失忆”或胡言乱语
-
工具整合后反而更复杂,不如手动快
很多“AI应用”其实就是个 GPT 外壳,加了几个按钮和调用接口,远远达不到 Agent 应该有的“自主思考+任务执行”能力。
OpenAI 推出 GPTs 和 Assistant API,试图走通 Agent 应用路径。国内也不乏模仿,但多数停留在工具层,产品逻辑和场景打磨非常粗糙。
字节的“扣子空间”让我看到一些不一样的东西:它试图真正把“AI当人用”,而不是“让人学着用AI”。
二、什么是“扣子空间”?一句话,它是一个 AI 工作空间,不是另一个 AI 聊天室
你可以把它想象成 Notion、Slack 和 GPT 合体后的形态,但核心是:它面向“任务”,不是“对话”。
在“扣子空间”里,每一个 Agent 都有明确的“职责”,它不是万能的问答机器,而是一个“智能员工”。比如:
-
有的 Agent 负责做竞品分析
-
有的 Agent 做用户研究报告
-
有的 Agent 做 A 股数据分析
这就像你在企业里配置的一组虚拟员工,每人有自己的技能栈、工具链和工作流程,能围绕一个目标把事儿干了。
在具体任务中,Agent 不是直接给一个结果,而是走一个完整的“理解目标—规划路径—调用工具—产出结果”的流程。这个流程不是靠 prompt 拼凑,而是一个逻辑清晰、可调试、可迭代的工作系统。
这才是 Agent 真正的落地方式。
三、从“探索模式”到“规划模式”,AI 要像人一样思考和规划
目前“扣子空间”内测了两种 Agent 工作流:
探索模式:你说什么它就做什么,适合发散型任务
规划模式:先理解你的目标,确认清楚再执行
规划模式的设计非常关键。这其实是对 OpenAI Deep Research 思路的本地化实现:在动手前先问清楚目标,不乱猜、不急做,提升输出的质量和稳定性。
我们实测一个“竞品分析”任务,在探索模式下,Agent 很快就能列出几家竞品和功能对比,但分析维度较粗,容易遗漏关键信息。
而在规划模式中,它会主动问清楚你的竞品类型、目标用户、分析深度,然后才开始构建结构化输出,包括:
竞品功能矩阵(表格)
用户反馈总结(来自各平台)
差异化机会建议(基于用户画像)
更重要的是,这个过程可以反复调整,中途你可以随时修改目标,它能灵活响应。这种交互体验,比起一问一答的 AI 聊天,显然更像是“共创”。
四、数据和工具的打通,才是 Agent 能力的分水岭
很多 Agent 项目难以落地的核心,不是技术不够,而是“数据割裂”和“工具无效”。
Agent 不是模型的展示舞台,而是数据和工具的总控中心。字节在这一点上做得比较彻底:
数据直连:可以直接访问飞书文档、表格、工作流
工具注册标准化:通过 MCP 协议整合第三方工具
结果多元输出:支持文档、图表、可视化组件的自动生成
比如我们测试一个任务“分析宁德时代未来三年在北美的扩张机会”,一个完整的结果包括:
GPT 总结的市场背景(大段语言文字)
自动生成的北美市场销量趋势图(基于财报数据)
企业合作动向时间轴(图形展示)
最后打包成汇报文档,一键导出飞书
这不是“AI生成文字”的场景,而是“AI完成工作”的场景。
这种场景落地能力,是 Agent 产品的生命线,也是市面很多“模型套壳工具”所不具备的。
五、“专家 Agent”才是真正的价值入口
通用 Agent 能做的事越来越像 GPTs,真正体现差异化的,是“专家 Agent”。
所谓专家,不是让 AI 模仿某个专家说话风格,而是“将专家的知识、经验、流程结构化封装成 Agent 模型”。
扣子空间目前上线了两个比较成熟的专家 Agent:
用户研究专家:能对访谈文本进行深度分析,提炼用户需求,生成产品建议
华泰 A 股助手:能基于华泰财经数据库和公开数据,分析企业走势,预测影响因素
我们做了一个案例测试:让用户研究专家对 5 位用户的原始访谈做需求梳理和产品建议,它自动识别用户的情绪、动机、痛点,并按产品设计维度输出建议表,几乎接近一个中级 PM 的工作水平。
这种专家 Agent 的可复制性,是 Agent 产品未来的重要增长点。
六、最后谈一点:为什么是字节做到了?
AI Agent 的落地,本质上是“产品、模型、数据、工具”四要素的协同问题。
字节具备一个独特优势:有数据、有工具、有产品敏感度,还有对“如何做平台”的认知。这些年来,扣子平台积累了超过 200 万个 AI 应用数据,背后有足够多的真实需求和失败教训。
在这样的背景下,“扣子空间”更像是一次系统性反思后的升级——从“AI应用百花齐放”到“构建一个能工作的 AI 人才系统”。
这不是实验室里的demo,而是产品线级的产品。
写在最后
今天市面上的 Agent 产品,90%都还在“拼积木”的阶段,把大模型、工具链、插件组合一下,希望能自动化一些任务。但真正从用户需求出发,构建完整工作流和可控行为系统的,还不多。
“扣子空间”不是终点,它只是说明了一件事:
Agent,不是一个功能,而是一种新型的交互和协作范式。
如果说 GPT 是搜索的下一代,那么 Agent 很可能就是“工作操作系统”的下一代。
谁能真正走通这条路,就能重构一部分知识工作流程。字节这一步,不算完美,但已经踏出了正确的方向。
出书了!DeepSeek超简单入门!扫码下单, 还可以附赠15篇飞书电子版本阅读福利。

购书的还可以获赠训练营文档。

