AI Agent可能会是大公司开放能力,专门的公司来制作Agent服务,或者提供服务的公司自己结合AI能力制作Agent
本周四(3.6),号称通用Agent的Manus突然火了起来,难道这么快Agent的ChatGpt时刻就到了吗?
很多人可能还不清楚Manus是什么,这里先简单用几句话介绍一下:
Manus是一个国产Agent模型,不同于聊天模型,用户问一个问题他不仅只是回答一下答案,而是会自主分解任务,逐步完成各个分解任务,用户只需要等着获取最终结果即可。
这个过程可能会花费较长的时间,它背后运行在多个虚拟机上,负责完成各个分解的任务和执行,任务的执行可能会用到浏览器、编程IDE等。
比如用户跟它说“需要四月份去日本旅游7天”,它接到任务后就会去查询各个信息,景点、酒店、机票、天气情况、旅游攻略等,然后生成一个旅行手册,安排好每一天的计划,方便用户安排游玩计划。
贴一个它的官网宣传视频:
但是,持续关注过AI的人可能会有似曾相识的感觉:这不是AgentGPT吗?
再贴一个AgentGPT的视频:
除此之外,还有个更底层的框架叫做:AutoGPT。
所以问题来了,它是真的有什么新的创新吗?它真的是像它号称的那样是通用Agent吗?
1. 是不是通用Agent
我在前面一些文章里讲过Agent的原理,它并不是模型拥有了什么新的特殊的能力,而是模型借助Function Calling获得了与外界工具交互的能力,本质上还是从各处取了一点数据,它来聚合生成。
理论上,通用Agent的目标是解决不限场景的任务。这意味着它需要具备调用各种工具的能力。
那么它会使用所有的工具吗?人不能但它是AI,完全有可能。
那它可以访问所有的工具吗?如果所有工具都能以HTTP的形式开放,Agent在技术上确实有可能访问它们。
从这个角度来说,Manus可以被认为是一个通用Agent。
2. 和AutoGPT有什么区别
它本质上就是给AutoGPT套了一个好用的界面,比AgentGPT的使用体验更好。AutoGPT是一个技术框架,而AgentGPT的产品设计更像是一个程序员产品。
这里先对比一下二者,Manus和AutoGPT。
对比维度 | AutoGPT | Manus |
相同点 | ||
|
|
|
|
|
|
不同点 | ||
用户定位 |
|
|
任务流程控制 |
|
|
灵活性 |
|
|
集成能力 |
|
|
3. 为什么说Manus营销推广大于实用
1)通用Agent不是新概念了
Manus和AutoGPT、AgentGPT等相比,本质上没有区别。UI、交互设计是竞争力,但可能不是第一竞争力。而当下AutoGPT、AgentGPT已几无声量,沉寂良久,作为国产厂商,我倒是希望Manus能杀出一条血路。
2)工具能力受限
不是所有的能力都是基于HTTP,也不是所有的能力都可以被公开访问。
拿上面的官方日本七日游的例子来举例,他肯定没办法帮我订机票订酒店。机票预定、酒店预定这些不是单纯的信息查询,涉及复杂的鉴权认证、交易、支付等复杂流程能力。这也是我认为Agent应用落地可能最先会由服务提供厂商实现的理由之一。
AI能力像是传统互联网时代的信道,有应用掌控权的还是数据拥有者。Agent也一样,重要的不是AI能力,而是拥有解决具体问题能力的服务提供方。
你可以通过携程让它的AI功能自动帮你预定日本七日游的酒店,而不能让AI能力自动帮你预定酒店。所以要么是一个个垂类的Agent应用先落地,要么是一个中心化的Agent公司,从各个服务能力所有者获得了授权,而后集中了一批的实用Agent,再统一提供通用的Agent服务。
3)现阶段实用性远未达到宣传预期
刚好刷推看到个帖子:

这大概就是实际终端用户在使用AI产品时的真实体感了,看似思考了很久,忙了一堆事情,结果你以为它“干了票大的”,但实际它“拉了坨大的”。。
很多时候,你从马蜂窝这样的旅游攻略网站上找了一份攻略,你都不一定愿意直接照做。而AI Agent也仅是帮你自动化地完成了信息检索、自行筛选生成了一份攻略,你不相信人做的适合你,同样地,你为何会认为AI做的会合适?
总结
Manus很有价值,它将AI自主决策实现任务拆解,提供端到端的处理结果产品化了,在信息处理、数据分析场景自动化了,避免了需要用户多次查询、整理。
但是它的创新有限,实用性还欠缺,还远算不上Agent的ChatGpt时刻。它现在还开启了邀请机制,网上甚至出现了高达8.8万元的邀请码交易,普通用户完全没有必要盲目追捧。。。
期待它能尽快研发,带来更多惹人瞩目的新功能新特性。让我们持续观望,让子弹再飞一会儿~
毕竟,
模型迭代浪潮涌,
各领风骚各不同。
你方唱罢我登场,
静待后浪逐前踪。