就在刚刚,OpenAI 发布了其 o 系列模型的最新成员 o3 和 o4-mini,这两款模型被认为是 OpenAI 迄今为止最智能的模型。它们经过训练后能够在做出反应前进行更长时间的思考,并且首次具备智能地使用和组合 ChatGPT 的所有工具的能力,包括网页搜索、Python 分析、视觉推理和图像生成。
模型能够自主判断何时以及如何使用这些工具,从而以正确的格式生成详细且周到的答案,更有效地处理复杂问题。这一突破性的推理能力与完全的工具访问权限相结合,使得新模型在学术基准测试和实际应用中都展现出显著的性能提升。
o3 在编码、数学、科学和视觉感知等领域打破了多项基准记录。
它尤其擅长处理需要多方面分析的复杂查询,并在分析视觉信息方面表现出色。专家评估显示,相比 o1,o3 在困难的现实任务中重大错误减少了 20%,尤其在编程、商业咨询和创意构思方面。
o4-mini 作为更小、更高效的模型,o4-mini 在保持卓越性能的同时,实现了快速且经济高效的推理,尤其在数学、编程和视觉任务方面表现突出,并为 AIME 设定了新的 SOTA。专家评估还显示,o4-mini 在非 STEM 任务和数据科学领域超越了其前身 o3-mini。由于其高效率,o4-mini 拥有更高的使用限制,适合高容量、高吞吐量的推理需求。
o3 侧重于强大的综合能力,而 o4-mini 则强调效率和速度,这两个模型与之前的推理模型相比,它们的体验也更加自然和更具对话性,尤其在参考记忆和历史对话时,响应更加个性化和相关。
同时,OpenAI 推出了一个名为 Codex CLI 的全新实验性工具,这是一个可在终端运行的轻量级编码代理,旨在将前沿推理能力带到命令行。
- 终端中的强大推理:
Codex CLI 旨在充分利用 o3 和 o4-mini 等模型的推理能力,并计划支持更多 API 模型,如 GPT-4.1。
- 本地多模态推理:
该工具的独特之处在于能够通过传递屏幕截图或低保真草图,在本地命令行环境中实现多模态推理,并能访问本地代码。
- 极简连接接口:
OpenAI 将其视为一个将模型直接连接到用户及其计算机的极简接口。
- 完全开源:
- 百万美元资助计划:
OpenAI 还宣布启动一项 100 万美元的计划,以支持使用 Codex CLI 和 OpenAI 模型进行的项目。资助将以 API 积分的形式发放,每笔最高 2.5 万美元。提案可以通过提供的链接提交。
总之,Codex CLI 是一个创新的开源工具,旨在将 OpenAI 最先进的推理能力直接带到开发者的终端,并支持通过多模态输入进行交互。