首款无限Agent Neo深度实测,出道两年半的AI转正了



Neo

拥有了无限步骤无限上下文无限工具,Neo 完全可以通过过量的搜索和推理,不再盲目相信搜索结果,而是把最高质量的信息提供给大模型,让大模型生成最合适的提示语和上下文。

首款无限Agent Neo深度实测,出道两年半的AI转正了

凌晨三点,我盯着屏幕上的 Neo,

任务还在跑,我甚至没动鼠标,

我的邮箱正安静地接收着第 17 轮自动报告,它正在抓取全球 AI 创业公司 CEO 们昨晚更新的 X 帖子,并根据我的口吻写两条新推文。

我之前试过太多 Agent。

有的能规划任务,但只能走五六步。

有的能生图,但中间思路完全看不到。

有的能联网搜索,但查出来的东西全是低质量内容。

Neo 身上的三个无限特质,第一次让我产生“我已经不是一个人在工作”的错觉。

怎么做才是无限呢?

Neo 的无限是,它可以在规定的时间内完成重复的复杂的任务,甚至可以以“年”为单位,只要我不主动终止任务且 token 额度充足,这个任务就可以一直重复、一直跑。

Neo 的无限还是,全自动输出100万字的内容,可以重写小说、电影甚至是电视剧结局,AI 能替代的角色又多了一位。

从我看or运行过的50+案例上看,Neo 除了基础的联网搜索、代码生成&运行,还可以完成邮件通知知识库融合看视频PPT生成浏览器使用等等使用场景的任务,而且质量很高。

我甚至感觉不出哪些是“人工输入”,哪些是“模型输出”,整个过程像是一个有主观能动性的数字生命在自己运转。

首款无限Agent Neo深度实测,出道两年半的AI转正了

跑案例前,

flowith 还提供了 Neo 在通用 AI Agent 能力测试 GAIA 中的表现:在三个难度级别里都拿到了最高分:

首款无限Agent Neo深度实测,出道两年半的AI转正了Manus VS OpenAI Deep Reserach" class="rich_pages wxw-img" data-ratio="0.5981481481481481" data-type="png" data-w="1080" style="display: block;margin: 0px auto;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);border-radius: 0px;object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;" data-imgfileid="100012110">

接下来我会根据无限步骤无限上下文无限工具来深度拆借四个案例,以及额外盘点6个用例、flowith 的基础使用和这次 Neo 的邀请码们。


 01|无限步骤 

我给 Neo 下的第一个指令,

是帮我每天追踪全球的AI动态,

虽然维护自己的信息源已经快两年了,尝试过各平台特别关心,用过 RSS、信息聚合、三方订阅等等,但还是会漏掉一些信息。

所以这次的提示语难度相当高,

我是一名用户体验设计师,需要创建一个网站每天自动更新新的设计趋势和资源。

使用在线搜索工具,搜索X(Twitter)和Reddit等社交媒体上用户体验博客作者的最新动态和信息及资源。

网站每日更新一次,更新时间为美国东部时间18:00,持续更新一年。

完成输入后,Neo 开始了一场超长的“规划”动作,

先来看看它长到有点离谱的执行过程,

首款无限Agent Neo深度实测,出道两年半的AI转正了

这些平行的块就是搜索过程,它们最终会汇总成一个完整的文本版日报。

首款无限Agent Neo深度实测,出道两年半的AI转正了

成功运行第一次后,Neo就会将任务需求、时间、注意事项等固定下来,

首款无限Agent Neo深度实测,出道两年半的AI转正了

而且改改需求会可以变成定时发送邮件,

首款无限Agent Neo深度实测,出道两年半的AI转正了

我什么都没动。

Neo 自己选、自己写、自己配图、自己排版、自己发邮件。

限制 Neo 的只剩下钱包里的 Token 额度了。

这里值得额外提一嘴,

flowith 用的是无限画布的形式,

不同于 OpenAI Deep Research 一次性输出结果,中间节点的输出的过程都可以进行二次追问。

首款无限Agent Neo深度实测,出道两年半的AI转正了


 02|无限上下文 

如果说以 OpenAI Deep Research 为代表,

Agent 擅长使用联网搜索收集多个信息源,通过推理模型筛选事实性信息,再整合输出研究报告。

Neo 就是在这个基础上再将能力放大两倍不止。

请在全网范围内搜索并了解《流浪地球》系列电影的背景和剧情,基于其世界观和故事线,创作《流浪地球3》的续集剧本,时长不少于两小时。每个关键剧情段落需配备相应的剧情概念图,并绘制完整的剧情发展脉络图。同时,为剧本中的关键场景和角色设计插图。开发一个支持多语言的网页平台,展示剧本内容、插图、角色介绍和剧情发展图,提供沉浸式的阅读体验。

一般 Agent 看到这个指令就挂了。

Neo 做到了什么?

一样是夸张的任务数量,

首款无限Agent Neo深度实测,出道两年半的AI转正了

Neo 先是检索了《流浪地球》的背景、人物、主线,还找到了导演的采访信息,合理的推测出后续的剧本

首款无限Agent Neo深度实测,出道两年半的AI转正了
首款无限Agent Neo深度实测,出道两年半的AI转正了

给每个关键剧情、人物角色,甚至是宇宙现象都配了概念图,

首款无限Agent Neo深度实测,出道两年半的AI转正了

然后开始生成网页,这一步非常像真人开发,先打一个能看全中英双语的粗网页,再优化UI、最后轮到交互动画。

这不是“响应式 AI”,这是“主动构建型智能体”。

它懂剧情节奏,懂结构逻辑,懂多模态联动,甚至还懂用户要什么样的体验。


 三、无限工具 

最后这一类我纠结了半天,

无限工具是指类似 600多个 MCP Servers 全封装进 Neo,

还是指 Neo 有自己的一套云端方案,理论上可以安装所有的已知工具。

都不是,

体验之后才发现真正无限的是 Agent,

在 Neo 里,Agent 可以主动给自己创建 Agent 来完成任务,无限套娃。

听起来有点拗口,我们结合案例来看看:

首款无限Agent Neo深度实测,出道两年半的AI转正了

案例来自我的好朋友@倒放

很明显,这次是要考 Neo 生图能力,

因为我给的已经不是具体的提示语了,它会自主搜集信息、完成提示语编写和图片生成的所有步骤,

首款无限Agent Neo深度实测,出道两年半的AI转正了

这里面它就创建了

搜索 Agent、生图 Agent、文档生成 Agent

首款无限Agent Neo深度实测,出道两年半的AI转正了


还有一个我很喜欢的 case,看视频合集 & PPT制作

完整并深度观看视频(地址:【这里看的是40分钟的 MIT 线性方程教学】),输出针对初学者的教学计划、PPT幻灯片,附加练习和说明。

ppt制作的很全,而且也给出了相应的答案,当初我上大学的时候如果有这玩意,我不知道得是个多么开心的小孩。


 还有,

这些案例,量大管饱:

  1. 生成一份比较报告,收集并分析 Nvidia 和 AMD 消费级显卡自2005年以来的更新与迭代,重点关注技术特性和性能迭代幅度。
首款无限Agent Neo深度实测,出道两年半的AI转正了
2.  重写权力的游戏第八季
首款无限Agent Neo深度实测,出道两年半的AI转正了
3.  给《黑神话:悟空》做一个宣传网页
首款无限Agent Neo深度实测,出道两年半的AI转正了
4. 以可视化的方式展示2022年至2025年5月人工智能领域重大投融资及并购事件。
首款无限Agent Neo深度实测,出道两年半的AI转正了
5. 使用交互式网页生成最佳选座指南,看来Neo坐飞机也喜欢前排
首款无限Agent Neo深度实测,出道两年半的AI转正了
6. 特斯拉Q1分析PPT
首款无限Agent Neo深度实测,出道两年半的AI转正了


 也有惊喜!

使用方法很简单,

因为邀请码相当有限,在评论区留下你对 Neo 的看法或者是最想让 Neo 帮你做的一件事,我会随机抽取16个,

同时上面提到的所有案例都整理好了,公众号回复“neo”就可以获取。

来看看 flowith 的基础玩法吧,

? flowith.io

首款无限Agent Neo深度实测,出道两年半的AI转正了

Agent 模式就是 Agent Neo,目前一天的对话次数是20次,一天快超过 OpenAI 一个月的量了。。。

flowith 集成的模型堪称豪华,gpt/o3/o4 mini、DeepSeek、claude、gemini、grok、glm、ideogram、flux、recraft、kling v1.6、veo2,可以满足基本对话联网搜索图片视频生成提示词生成,以及我使用频率最多的比较模式

flowith 本身还带知识库功能,让知识重新流动,

首款无限Agent Neo深度实测,出道两年半的AI转正了

内置了365个知识库,

在对话开始的时候可以选择是否让模型读取知识库。


 写在最后 

我打心底佩服 flowith。

这群在硅谷+上海两地作战的年轻人,用不到一年时间,从 Agent Oracle 到 Neo,已经完成了我原以为五年都做不到的事情:

构建了一个真正有自我主张、有计划、有创作欲望的智能体。

flowith 从来不是做模型的,

他们做的是“AI如何变成你的工作搭档”。

Neo 就是一个现在进行时。

它已经在跑任务,在接工作,在接管我们过去每天需要10个app和3个同事的事情。

你可以说它是 Agent,也可以说它是原型 AGI。

但我更愿意说:它是未来人类工作结构的一个前哨。

我现在已经不再纠结“用哪个模型”。

我只想知道:这个 Agent 能不能在我不说话的时候,自己把事情做完。

Neo 能。

而且做得不差。

我非常清楚,它仍有很多不足:

一些任务复用时需要你重复解释 prompt

个别模型调用失败时会卡在流程里,

网页生成部分仍不够美观,需要设计师介入,

但我一点都不在乎。

因为这已经是我目前见过超像 AGI 的 Agent 了。

它能在你睡着时,帮你跑完 30 个流程;

能在你不回复时,继续重试并找方案;

能在你没说清楚时,主动给出预案和建议;

这就够了。

你可能现在还在犹豫要不要用 Agent。

但我建议你至少去试一次 Neo。

别再研究模型的推理方式、提示语写得如何复杂。

试着让 Neo 做一件你已经厌倦的事情,比如每天抓 AI动态,比如收集演讲视频并写结构化 PPT,比如写新闻分析。

然后你会发现:

有一天,你真的不需要动手,

一整套工作流,就被 AI 自动完成了。

工作变成了和 Neo 对话,而不是用手敲字。

这不就是我们曾经梦想的“AI时代”?

现在真的开始了。

前沿技术大模型技术新闻资讯

浅析军事大模型的构建逻辑与赋能路径

2025-5-20 22:21:11

前沿技术多模态技术新闻资讯

Gemini接管搜索、全家桶秒变通用Agent ,以及Google Glass is so back!|直击Google I/O

2025-5-21 8:44:19

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索