Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的…操控整个浏览器


★ 设为星标 | 只讲人话,带你玩转AIGC。

现在的 OpenAI,越来越像 Anthropic 了,几乎每天都有新东西发布。

昨天晚上除了发布三个新的语音模型之外,他们还上线了一个 Codex 的 Chrome 插件。

这个插件最核心的能力,就是它终于可以直接操作你已经登录好的浏览器了。

Codex 之前本来就内置了浏览器吗,但它没法操作那些需要登录的网站。

比如你的邮箱、小红书、微博、公司后台、会员系统、企业工作台……

这个能力,其实有点像之前很多人用过的 Claude for Chrome,现在 OpenAI 也加上了。

要使用很简单,先更新 Codex,然后到 Plugin 里面安装 Chrome 插件:

Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器
图:安装 Chrome 插件
Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器
图:安装 Chrome 插件

安装完之后,就可以直接在 Codex 里面 @Chrome 来操作了,比如我让它帮我自动发个微博:

Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器
图:Codex 调用 Chrome 自动发微博

然后就看到一条微博自动发好了,内容也都是它自己编辑的:

Codex 发布了 Chrome 插件,能替你填表、报销、玩游戏的...操控整个浏览器
图:Codex 自动发的微博

这个例子太简单了,主要是为了要演示一下基本功能。

但说实话,看了昨晚的演示视频,这玩意的上限远不止发个微博这么简单。

视频里提到了几个非常硬核的功能: 首先是“身份共享”。

因为它是以插件形式运行在你的 Chrome 里的,所以它能直接调用你浏览器里的所有 Cookie 和登录状态。

这意味着它不需要你再输一遍账号密码,就能在你的“真实工作环境”里折腾,安全性也比把账号托管给第三方强。

其次是“多标签页并行”。它可以同时监控、抓取好几个网页里的内容,甚至能跨标签页执行任务。

为了展示这个能力,视频里跑了几个更复杂的案例,看得我心痒痒:

第一个是“全自动舆情调研”。

演示里让 Codex 去 OpenAI 的官方社区里逛逛,它不只是扫一眼,而是自己会翻页、抓取最近一周的所有帖子,然后分析哪些用户在吐槽、哪些在夸,最后直接在你浏览器里生成一个表格总结。

这种以前要写爬虫干的活,现在一句话就搞定了。

第二个是“差旅报销闭环”。

这个非常实用,它先去 Gmail 插件里翻找最近的出差收据,把日期、金额全抠出来。

然后,重点来了。

它自动打开了报销网站,把收据 PDF 传上去,顺带把表单里的每一个空格都填好了。

这种跨平台(邮件到网页)的自动流,才是真的解放双手。

最离谱的是最后一个演示,“多代理协同”。

视频里开了四个标签页,跑了四个 Codex 代理去玩一个在线协作绘画游戏。

它们能实时看到对方画了什么,然后商量着一起补全一幅画。

这种“群聊式”的网页操控,给未来的办公协同留足了想象空间。

这个插件是在单独的标签页里面处理这些新任务的,所以它不是完全接管了你的浏览器。

也就是说,你还可以继续在浏览器里干你的事情,而它在后台默默地帮你把那些自动化的事情处理掉。并不是说它在运行的时候,你就不能用浏览器了。

总之,OpenAI 这次补齐了 Codex 最关键的一块拼图。

以后我们用的可能不再是一个聊天框,而是一个能跑在任何网页背后的“数字员工”。


Skill前沿技术新闻资讯

我用半年筛出来的 9 个 Skill,知识工作者必备

2026-5-8 14:13:44

前沿技术提示词技巧新闻资讯

对Claude Code官方的祛魅!

2026-5-3 22:11:40

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索