奥特曼:Codex 正在经历 ChatGPT 时刻。这是要起飞了

假期里看到 OpenAI 的 CEO 奥特曼发文说:Codex 正在经历 ChatGPT 时刻……


奥特曼:Codex 正在经历 ChatGPT 时刻。这是要起飞了


这篇短文获得了 96 万阅读,看起来大家有点感同身受,Codex 自从更新了这个叫“Codex 全能型助手”的版本之后,开始大踏步前行,步履坚定,眼神中充满了圣地延安就在某个不远前方的坚定。奥特曼甚至狂妄的夸下海口,如果世界将只剩下两个 Coding Agent,那将是 Claude Code 和 Codex。你看,奥老师在激动之余,还是很严谨的把 CC 放在了前面,非常得体。


我现在 Claude Code 和 Codex 用的比较多,根据套餐、5 小时和周份额,做了精密的设计,一三五日 CC,二四六 Codex,灵活调整,走位飘忽,主要看一个烧字。


用下来之后,感觉 Codex 新版加上 GPT 5.5,确实脱胎换骨,主动性都增加了。有一天我打开 Codex,它在对话框下方提醒我,老板,你最近在搞的三个项目,需要同时启动,我给你给搞个一键联调启动方案吧……我说好呀好呀,咔,人家就搞完了……


奥特曼:Codex 正在经历 ChatGPT 时刻。这是要起飞了


Codex 是如何获得突飞猛进的呢?大致可以分这么几条主线来看。


1、模型与能力升级


最近比较大的变化,是 GPT‑5.5、GPT‑5.4 / 5.4‑mini、GPT‑5.3‑Codex 这些新模型陆续进入 Codex 体系:


GPT‑5.5 已经在 Codex 里作为推荐默认模型之一,用来做复杂编码、重构、调试、测试和知识类工作,用下来真的是嘎嘎香,还没有那么费 Token;5.4 则是更通用的“主力模型”,在 Codex 里带来了 1M 长上下文、原生 computer use 和更强的工具搜索;5.4‑mini 面向“轻量子任务”和子代理,用更便宜更快的方式跑代码理解、大文件浏览、支线分析之类工作。当额度不够的时候,Codex 会主动问你要不要降到这个模型;5.3‑Codex 走的是“极快响应”的路线,牺牲一点综合能力,换取近乎实时的编码反馈。


大模型负责规划、判断和高难度修改,小模型负责扫描代码库、跑子任务、长对话上下文压缩,人家分工相当明确。


2、CLI:命令行工具增强


CLI 对标的就是 Claude Code。虽然 OpenAI 的重心显然是 Codex App,不过最近CLI 这几版(0.120–0.128)更新还挺密集的:


一是长期任务与多代理。MultiAgentV2 的配置被做得更显式:有线程上限、深度/等待时间控制,还有 root / subagent 提示,让多代理协作不再是黑盒。同时,新增了 ‎⁠/goal⁠ 持久化工作流:你可以给 Codex 一个长期目标,它会以目标为单位持久化到 app‑server,有 API、TUI 命令,可以创建、暂停、恢复、清理,相当于在 CLI 里内置了一个“半自动任务编排器”。


二是安全与权限模型。Codex 一直在把“权限”当成一等公民,这点比 CC 谨慎,CC 虽然有沙箱模式,但不用沙箱真是香啊。


以前 Codex 的各个模块(终端界面、沙箱、网络、API 等)各管各的权限,比较零散。现在它搞了一个叫 profile 的东东,把所有权限配置集中到一起管理:TUI、用户会话、MCP 沙箱状态、app‑server API、Linux / Windows sandbox、网络代理都围绕 profile 构建。旧的 ‎⁠--full-auto⁠ 被明确弃用了,用户需要通过 profile 和明确的信任提醒来授权。本地 fs、网络、Bedrock、远程 sandbox、exec‑server 的权限路径基本都统一到这套 profile 上了。


三是生态与运维。CLI 新增了 codex update 自更新命令,改进了 TUI 的快捷键、状态行、终端标题、弹窗布局等交互细节;插件方面支持了 marketplace 安装、远程插件缓存、卸载、hook 开关以及外部 agent 会话导入。底层则在持续拆分 Rust crate、迁移 Bazel、稳定 CI 和 release 流水线,保证这个”本地 agent runtime”本身足够稳定。


喜欢命令行的,完全可以用 Codex CLI 过瘾,命令行权限也更大一些。


3、应用层:从“智能编程助手”走向了“统一的工作空间”


Codex app 这几个月的更新,确实从一个编程工具走向了“Codex 全能型助手”,给了用户一个统一的工作空间。


Chats 拆分成了“对话”和“项目”,不再强依赖项目的目录,可以先研究、写作、分析,想操作文件了,再引入项目和文件夹都可以。“自动化”支持按计划唤醒某个线程,帮你定时检查、更新、延续某个任务;thread 搜索、归档、worktrees 和多窗口 / 菜单栏托盘,也都是围绕“多项目、多任务并行”在打磨。


奥特曼:Codex 正在经历 ChatGPT 时刻。这是要起飞了


插件市场整合了精选、编程、设计和生活方式等一系列插件,内置 in‑app browser 可以让 Codex 直接在本地预览 UI、复现视觉 bug、在 app 内验证修复;computer use 则负责操作 macOS 原生应用,用来跑模拟器流程、点界面按钮、改设置、处理 GUI 里的“只能点不能脚本化”的东西。两者叠加,Codex 除了读文件写代码运行命令之外,还能看界面和动手操作。强大的贾维斯呼之欲出。


奥特曼:Codex 正在经历 ChatGPT 时刻。这是要起飞了

这是墨问的技能,还没发布


PR 的工作流也被搬进了 app:侧边栏可以看 GitHub PR、review 评论、diff,Codex 能针对这些 review 做解释、修改、再检查。一些更偏“知识工作”的能力,比如 artifact viewer 预览 PDF / 表格 / 文档 / PPT,加上 Memories 带来的偏好和项目约定迁移,也让 Codex 逐步从“写代码工具”向“综合生产力工具”进化。


Codex 还提供了自己的 SDK(TypeScript),让用户在自有工具里直接启动 agent 线程。加上 GitHub Action、Slack / Linear 集成、非交互模式,以及 Windows 原生 app 和 VS Code / Cursor / Windsurf 等 IDE 插件,同一套 agent 能力基本覆盖了方方面面。


看起来奥特曼老师一直心心念念的第二个超级 App,应该就是 Codex 无疑了。


这俩月,Codex 一边接入新模型、一边升级自己的 harness 工具,Agent 能力、安全、生态和工作流全面进化,现在真的是妥妥的一个电脑智能助手了,再加个 通道 连接 IM 工具,那可就是个妥妥的大龙虾了。


就桌面端 App,我的理解是:Codex > Claude > Gemini。Google 还是有点摇摆,Gemini App 刚发布,AntiGravity 主打 IDE 和 Agent,似乎在各干各的,Codex 就不一样了,通吃,还做的挺优雅。nice

RAG技术前沿技术新闻资讯

Chonkie:开源、轻量、极速的 RAG 分块神器 🦛

2026-5-3 8:21:01

前沿技术多模态技术新闻资讯

99%的人不知道Claude的一句话生成SVG图片功能

2025-5-17 14:13:49

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索