首款无限Agent Neo深度实测，出道两年半的AI转正了

Neo

拥有了无限步骤、无限上下文和无限工具，Neo 完全可以通过过量的搜索和推理，不再盲目相信搜索结果，而是把最高质量的信息提供给大模型，让大模型生成最合适的提示语和上下文。

凌晨三点，我盯着屏幕上的 Neo，

任务还在跑，我甚至没动鼠标，

我的邮箱正安静地接收着第 17 轮自动报告，它正在抓取全球 AI 创业公司 CEO 们昨晚更新的 X 帖子，并根据我的口吻写两条新推文。

我之前试过太多 Agent。

有的能规划任务，但只能走五六步。

有的能生图，但中间思路完全看不到。

有的能联网搜索，但查出来的东西全是低质量内容。

Neo 身上的三个无限特质，第一次让我产生“我已经不是一个人在工作”的错觉。

怎么做才是无限呢？

Neo 的无限是，它可以在规定的时间内完成重复的复杂的任务，甚至可以以“年”为单位，只要我不主动终止任务且 token 额度充足，这个任务就可以一直重复、一直跑。

Neo 的无限还是，全自动输出100万字的内容，可以重写小说、电影甚至是电视剧结局，AI 能替代的角色又多了一位。

从我看or运行过的50+案例上看，Neo 除了基础的联网搜索、代码生成&运行，还可以完成邮件通知、知识库融合、看视频、PPT生成、浏览器使用等等使用场景的任务，而且质量很高。

我甚至感觉不出哪些是“人工输入”，哪些是“模型输出”，整个过程像是一个有主观能动性的数字生命在自己运转。

跑案例前，

flowith 还提供了 Neo 在通用 AI Agent 能力测试 GAIA 中的表现：在三个难度级别里都拿到了最高分：

接下来我会根据无限步骤、无限上下文、无限工具来深度拆借四个案例，以及额外盘点6个用例、flowith 的基础使用和这次 Neo 的邀请码们。

01｜无限步骤

我给 Neo 下的第一个指令，

是帮我每天追踪全球的AI动态，

虽然维护自己的信息源已经快两年了，尝试过各平台特别关心，用过 RSS、信息聚合、三方订阅等等，但还是会漏掉一些信息。

所以这次的提示语难度相当高，

我是一名用户体验设计师，需要创建一个网站每天自动更新新的设计趋势和资源。

使用在线搜索工具，搜索X（Twitter）和Reddit等社交媒体上用户体验博客作者的最新动态和信息及资源。

网站每日更新一次，更新时间为美国东部时间18:00，持续更新一年。

完成输入后，Neo 开始了一场超长的“规划”动作，

先来看看它长到有点离谱的执行过程，

这些平行的块就是搜索过程，它们最终会汇总成一个完整的文本版日报。

成功运行第一次后，Neo就会将任务需求、时间、注意事项等固定下来，

而且改改需求会可以变成定时发送邮件，

我什么都没动。

Neo 自己选、自己写、自己配图、自己排版、自己发邮件。

限制 Neo 的只剩下钱包里的 Token 额度了。

这里值得额外提一嘴，

flowith 用的是无限画布的形式，

不同于 OpenAI Deep Research 一次性输出结果，中间节点的输出的过程都可以进行二次追问。

02｜无限上下文

如果说以 OpenAI Deep Research 为代表，

Agent 擅长使用联网搜索收集多个信息源，通过推理模型筛选事实性信息，再整合输出研究报告。

Neo 就是在这个基础上再将能力放大两倍不止。

请在全网范围内搜索并了解《流浪地球》系列电影的背景和剧情，基于其世界观和故事线，创作《流浪地球3》的续集剧本，时长不少于两小时。每个关键剧情段落需配备相应的剧情概念图，并绘制完整的剧情发展脉络图。同时，为剧本中的关键场景和角色设计插图。开发一个支持多语言的网页平台，展示剧本内容、插图、角色介绍和剧情发展图，提供沉浸式的阅读体验。

一般 Agent 看到这个指令就挂了。

Neo 做到了什么？

一样是夸张的任务数量，

Neo 先是检索了《流浪地球》的背景、人物、主线，还找到了导演的采访信息，合理的推测出后续的剧本

给每个关键剧情、人物角色，甚至是宇宙现象都配了概念图，

然后开始生成网页，这一步非常像真人开发，先打一个能看全中英双语的粗网页，再优化UI、最后轮到交互动画。

这不是“响应式 AI”，这是“主动构建型智能体”。

它懂剧情节奏，懂结构逻辑，懂多模态联动，甚至还懂用户要什么样的体验。

三、无限工具

最后这一类我纠结了半天，

无限工具是指类似 600多个 MCP Servers 全封装进 Neo，

还是指 Neo 有自己的一套云端方案，理论上可以安装所有的已知工具。

都不是，

体验之后才发现真正无限的是 Agent，

在 Neo 里，Agent 可以主动给自己创建 Agent 来完成任务，无限套娃。

听起来有点拗口，我们结合案例来看看：

案例来自我的好朋友@倒放

很明显，这次是要考 Neo 生图能力，

因为我给的已经不是具体的提示语了，它会自主搜集信息、完成提示语编写和图片生成的所有步骤，

这里面它就创建了

搜索 Agent、生图 Agent、文档生成 Agent

还有一个我很喜欢的 case，看视频合集 & PPT制作

完整并深度观看视频（地址:【这里看的是40分钟的 MIT 线性方程教学】），输出针对初学者的教学计划、PPT幻灯片，附加练习和说明。

ppt制作的很全，而且也给出了相应的答案，当初我上大学的时候如果有这玩意，我不知道得是个多么开心的小孩。

还有，

这些案例，量大管饱：

生成一份比较报告，收集并分析 Nvidia 和 AMD 消费级显卡自2005年以来的更新与迭代，重点关注技术特性和性能迭代幅度。

2. 重写权力的游戏第八季

3. 给《黑神话：悟空》做一个宣传网页

4. 以可视化的方式展示2022年至2025年5月人工智能领域重大投融资及并购事件。

5. 使用交互式网页生成最佳选座指南，看来Neo坐飞机也喜欢前排

6. 特斯拉Q1分析PPT

也有惊喜！

使用方法很简单，

因为邀请码相当有限，在评论区留下你对 Neo 的看法或者是最想让 Neo 帮你做的一件事，我会随机抽取16个，

同时上面提到的所有案例都整理好了，公众号回复“neo”就可以获取。

来看看 flowith 的基础玩法吧，

? flowith.io

Agent 模式就是 Agent Neo，目前一天的对话次数是20次，一天快超过 OpenAI 一个月的量了。。。

flowith 集成的模型堪称豪华，gpt/o3/o4 mini、DeepSeek、claude、gemini、grok、glm、ideogram、flux、recraft、kling v1.6、veo2，可以满足基本对话、联网搜索、图片视频生成、提示词生成，以及我使用频率最多的比较模式。

flowith 本身还带知识库功能，让知识重新流动，

内置了365个知识库，

在对话开始的时候可以选择是否让模型读取知识库。

写在最后

我打心底佩服 flowith。

这群在硅谷+上海两地作战的年轻人，用不到一年时间，从 Agent Oracle 到 Neo，已经完成了我原以为五年都做不到的事情：

构建了一个真正有自我主张、有计划、有创作欲望的智能体。

flowith 从来不是做模型的，

他们做的是“AI如何变成你的工作搭档”。

Neo 就是一个现在进行时。

它已经在跑任务，在接工作，在接管我们过去每天需要10个app和3个同事的事情。

你可以说它是 Agent，也可以说它是原型 AGI。

但我更愿意说：它是未来人类工作结构的一个前哨。

我现在已经不再纠结“用哪个模型”。

我只想知道：这个 Agent 能不能在我不说话的时候，自己把事情做完。

Neo 能。

而且做得不差。

我非常清楚，它仍有很多不足：

一些任务复用时需要你重复解释 prompt

个别模型调用失败时会卡在流程里，

网页生成部分仍不够美观，需要设计师介入，

但我一点都不在乎。

因为这已经是我目前见过超像 AGI 的 Agent 了。

它能在你睡着时，帮你跑完 30 个流程；

能在你不回复时，继续重试并找方案；

能在你没说清楚时，主动给出预案和建议；

这就够了。

你可能现在还在犹豫要不要用 Agent。

但我建议你至少去试一次 Neo。

别再研究模型的推理方式、提示语写得如何复杂。

试着让 Neo 做一件你已经厌倦的事情，比如每天抓 AI动态，比如收集演讲视频并写结构化 PPT，比如写新闻分析。

然后你会发现：

有一天，你真的不需要动手，

一整套工作流，就被 AI 自动完成了。

工作变成了和 Neo 对话，而不是用手敲字。

这不就是我们曾经梦想的“AI时代”？

现在真的开始了。

{{userData.name}}已认证