Claude Sonnet 4.6 编程实测：免费用户也能用Opus级编程能力

昨天 Anthropic 发了 Claude Sonnet 4.6，免费用户默认模型直接升级到 Opus 级别。

我用了一晚上实测，说句实话：这可能是今年性价比最高的一次模型升级。

01 Sonnet 4.6 到底升了什么

先摆数据。

Sonnet 4.6 在 Claude Code 内测中，70% 的开发者更偏好它而不是上一代 Sonnet 4.5。更夸张的是，59% 的人甚至觉得它比 Opus 4.5 好用。

这个数字什么概念？Opus 4.5 是去年 11 月 Anthropic 的旗舰模型，API 价格是 Sonnet 的 5 倍。现在一个便宜 5 倍的模型，用户体感居然更好。

Agentic 基准评测对比表（Sonnet 4.6 vs Opus vs Gemini 3 Pro vs GPT-5.2）" class="rich_pages wxw-img" data-ratio="0.5" data-w="2600" style="display: block;max-width: 100%;height: auto;margin: 20px auto;border-radius: 8px;box-shadow: 0 4px 12px rgba(0,0,0,0.08);opacity: 1;" data-aistatus="1">

核心改进几个方面：

编程能力暴涨。 开发者反馈最多的是：Sonnet 4.6 会先读完上下文再改代码。之前 Sonnet 经常上来就动手，改完发现跟已有逻辑冲突。4.6 版本明显在"理解"上下了功夫，共享逻辑会合并而不是复制，多步任务的完成率高了很多。

1M token 上下文窗口（beta）。 100 万 token，够装一整个中型代码库。之前 Sonnet 4.5 是 200K，现在直接翻 5 倍。这意味着你可以把整个项目丢进去，让它全局理解后再改——不用再手动切片喂。

Computer Use 大幅进步。 OSWorld 基准测试上，Sonnet 系列 16 个月的进步曲线相当夸张。从 Sonnet 3.5 的 14.9% 一路飙升到 Sonnet 4.6 的 72.5%。4.6 版本的用户已经看到"接近人类水平"的操作能力：在复杂表格里导航、填写多步表单、跨多个浏览器 tab 协调操作。

价格不变。 $3/$15 per million tokens，跟 Sonnet 4.5 完全一样。免费用户直接用，Pro 用户默认切换。

02 实测体感：Claude Code 里的变化

我日常用 Claude Code 写代码，Sonnet 4.6 切上去之后，最明显的三个变化：

第一，不再"过度工程化"了。

之前用 Sonnet 4.5 让它改一个函数，它经常把半个文件重构了。你只想加个参数，它给你拆出三个新文件。4.6 明显克制了很多，你让它改什么就改什么，不多不少。

这一点其实比什么 benchmark 分数都重要——做工程的人最怕 AI 自作主张。

第二，长 session 不再"忘事"。

1M 上下文 + compaction（自动压缩历史对话）的组合拳很有效。以前聊到第 30 轮，它已经忘了第 5 轮你说的架构决策。现在明显记得住，而且会主动引用前面的上下文。

第三，指令跟随明显提升。

你说"只改这一行"，它真的只改这一行。你说"用 TypeScript 写"，它不会突然蹦出 JavaScript。这听起来很基础，但之前真的经常翻车。

开发者对 Sonnet 4.5 最大的吐槽就是"偷懒"和"不听话"。4.6 在这两个点上都改进了。

03 Sonnet 4.6 vs Opus 4.6：什么时候还需要 Opus？

既然 Sonnet 4.6 这么强，Opus 还有用吗？

有，但场景在缩小。

需要 Opus 的场景：

超复杂的多文件重构

：涉及 10+ 文件的架构级改动，Opus 的全局规划能力还是更强
高难度推理任务

：数学证明、复杂算法设计，Opus 的 thinking 深度更高
关键业务代码审查

：出不得错的场景，Opus 多花的钱买的是更低的幻觉率

Sonnet 够用的场景（也是 90% 的日常场景）：

单文件 / 少量文件的功能开发
Bug 修复和调试
代码解读和文档生成
前端页面开发（早期用户反馈 Sonnet 4.6 的前端设计感特别好）
API 接口开发
测试用例编写

我的建议：日常开发全用 Sonnet 4.6，遇到真正难啃的骨头再切 Opus。省下来的钱能多跑 5 倍的请求。

04 新功能速览

除了模型本身，这次还带了几个实用功能：

Context Compaction（上下文压缩）。 对话快到 token 上限时，自动把老对话压缩成摘要，保留关键信息。这让 1M 的有效利用率更高，不再白白浪费 token 存一堆无关历史。

Adaptive Thinking（自适应思考）。 简单问题快速回答，复杂问题自动启用深度推理。你不用手动选"思考模式"了，模型自己判断。

Web Search + Code Execution 联动。 API 端的搜索工具现在会自动写代码过滤搜索结果，只把有用的内容留在上下文里。这对 Agent 开发者很有用——之前搜索结果里一堆垃圾占 token。

File Creation。 直接在对话里创建文件，不用再复制粘贴。在 Claude Code 里这个功能已经有了，现在 claude.ai 也支持。

05 对 AI 编程的影响

说点大的。

Sonnet 4.6 的发布传递了一个很明确的信号：AI 编程的门槛正在大幅降低。

以前想用顶级 AI 编程助手，你得付 Opus 的价格（$15/$75 per million tokens）。现在同样的体感，Sonnet 价格（$3/$15）就能拿到。

免费用户更爽——直接用 Sonnet 4.6，不用付钱就能体验接近 Opus 级别的编程能力。

这对整个行业意味着什么？

更多人会开始用 AI 写代码。 价格门槛没了，能力门槛没了，剩下的就是认知门槛。谁先学会跟 AI 协作编程，谁就有优势。

Cursor 的压力更大了。 VS Code 刚刚发布 1.109 版本支持多 Agent 编排，现在 Claude 这边又把模型能力打上来了。开发者的选择越来越多。

Claude Code 会成为更多人的主力编程工具。 Sonnet 4.6 + Claude Code 的组合，日常编程体验已经非常接近 Opus + Claude Code 了。性价比极高。

{{userData.name}}已认证

Claude Sonnet 4.6 编程实测：免费用户也能用Opus级编程能力

算能端侧 AI 盒子 Stable Diffusion 一秒一张图：AirBox BM1684X

Cursor 的最佳搭档来了，专治不会写提示词！