Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

我比较爱玩,一般周末都是不更新文章的。昨天很晚回到家,刷了会儿关注的AI大佬,看到一个消息:前天,openAI上线了一个基于云端的软件编程代理–Codex。

今天的计划是爬山,早上早起去查阅了一圈Codex的相关信息,对这个东西做了一个整体的了解。爬完山回来后,赶紧写文,给大家分享一下。

Codex是个啥??
//

简单来说,Codex就是OpenAI搞出来的一个基于云端的AI编程代理。

等下,这听起来好像和Cursor、Windsurf这些AI编程工具差不多?不不不,差太多了好吧!

那些工具本质上就是给IDE(集成开发环境)加了个AI辅助功能,你还是主角,AI就是个工具人。

但Codex可倒好,直接反客为主了属于是!它就像是一个有自己想法的编程搭档,AI当主导,你反而变成辅助的那个,有没有一种世界颠倒的感觉?

OpenAI这角度切入的,我只能说,高,实在是高!

Codex有两种用法:

  1. Codex CLI:在本地终端跑
  2. Codex云端代理:直接用OpenAI的云算力,还能同时并行处理多任务,每个任务都在自己的沙箱(虚拟环境)里跑,意思就是——运行这个代码操作是不会影响你自己的主机的,爽不爽?

Codex背后的模型?
//

emmm,咱们都知道,一个编程助手有多强,完全看它背后的大模型有多牛。Codex背后是啥呢?codex-1!就是OpenAI基于o3模型专为码农优化的版本,使该模型具备高度贴近人类风格的代码编写能力。

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

OpenAI自己都吹爆了,说这是他们史上最强代码模型!我当时看到这个就想:嚯,吹这么大,是不是真有两把刷子?

在SWE-Bench测试中它就是比基础模型o3-high强,还在OpenAI内部测试中准确率达到了75%!这是什么概念?就是说四个bug能自动修三个???程序员要失业了啊喂!

OpenAI 内部 SWE 任务是指 OpenAI 公司在其内部使用的软件工程任务,用于测试和评估 Codex 的性能和能力。这些任务涵盖了不同的编程场景和技术挑战,包括代码重构、测试编写、代码调试等方面。通过对这些任务的评估,可以更好地了解 Codex 在不同场景下的表现,并对其进行改进和优化。

关键是,这还是在没配置"AgentS.md文件"的情况下的成绩!配置了岂不是要上天?(这个文件就像Cursor的Rules文件一样,可以控制AI的行为模式)

还有,这玩意儿支持192k tokens的超大上下文!比ChatGPT长多了!就,整个代码库它都能看,不用担心超出token限制,想想就有点可怕…

Codex能干啥?
//

  1. 代码编写:不只是写代码,它能根据你的需求开发新功能,帮你修Bug,甚至还能自己提交到Github!啥?你说我好像没事干了?…确实…

  2. 代码测试:写完代码自己就会测试,测试不通过就自己修,直到通过为止。讲真,比我这个测试就靠print的人强多了…

  3. 代码分析/问答:这货能快速理解整个代码库,你问啥它答啥。甚至还能主动找出项目的潜在问题,提出改进建议!是不是感觉雇了个技术总监?

  4. 多任务并行:最离谱的是,它还能同时处理多个任务,修多个Bug、优化多个模块,简直就是编程界的"分身大法"!我一个任务都处理不好,它倒好,多线程是吧?

Codex怎么用?
//

可惜啊,目前只对ChatGPT Pro、Enterprise和Team用户开放,我这种Plus用户还没资格体验(穷哭)。不过据说很快就会开放给我们这些"平民"了,搓手手等待ing…

下面是根据网上资料整理的使用流程:

首先,通过ChatGPT侧边栏找到Codex:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

第一次用要绑定GitHub账号(废话,它得知道往哪提交代码啊):

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

然后创建环境,选一个GitHub项目:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!
Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

之后它会默认给你选三个任务模式:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

  1. 解释这个仓库
  2. 找Bug修Bug(你甚至可以直接说"这有bug但我不知道在哪",然后躺平)
  3. 自动生成四个任务:修拼写错误、修bug、改文档、改测试(全方位体检是吧)

点击开始后,就像和ChatGPT聊天一样使用:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

OpenAI会创建沙箱环境运行任务:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

你能看到它对代码的所有修改:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

确认没问题后,一键推送到GitHub:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

然后你就能在GitHub上看到提交记录了:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

已完成的任务还能查看详情:

Cursor要凉?OpenAI发布的Codex让我彻底躺平了!

最变态的是,Codex还支持手机端发起任务并查看进度!

就是说…我躺沙发上刷剧的时候,丢个需求给它,等它做完我确认一下就行了???

这不就是我梦寐以求的打工方式吗?!AI干活,我划水摸鱼,只负责最后验收…这工作也太轻松了吧!程序员以后是不是都变成"甲方"了?

其实说真的,虽然每次看到这种新工具都有点担心自己哪天会被AI替代,但转念一想,与其抗拒,不如拥抱啊!让AI做苦力活,我们人类专注于更有创造性的工作,岂不美哉?

所以,学会用好这些工具,才是真正的职场进化之道啊朋友们!你们说是不是?

前沿技术多模态技术新闻资讯

推翻传统RAG,腾讯用生成式检索打开多模态新局面

2025-5-18 18:27:14

RAG技术前沿技术新闻资讯

一文彻底搞懂智能体Agent基于ReAct的工具调用

2025-5-18 18:45:12

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索