Claude Code 太烧钱了?我用这 5 招,把 token 成本砍了一半!

很多人用claudeCode都一个错觉:

1、我只写了几个小功能,token就没了

2、一天随随便便用了几十美元的token,算下来甚至怀疑,难道比请个实习生还贵!

别慌,今天交给你5个省钱的小妙招,亲测下来,用好了,能省下一半的token。

原理:为什么claude这么烧钱?

先把底层逻辑给大家讲清楚,不然你只会一边心疼钱,但是一边继续烧钱。

1、每次对话都要重新读取上下文,聊得越久,花的越多。

2、系统内置prompt提示词约占18k的提示词,基本上还没开始干活,先交token

3、opus模型超级贵,比sonnet模型贵很多

4、很多人为了保证质量,写了很多rulues,.claude/rules/ 这个玩意可是每条消息都会加载。

5个省钱小妙招(收藏用起来吧)

那么知道原理了,我们就知道在哪里省下成本了?

第一条:普通任务用sonnet,特殊任务用****opus

Claude Code 太烧钱了?我用这 5 招,把 token 成本砍了一半!

看到sonnet4.6基本上能省下40%的token。

其实随着模型能力的加大,普通模型sonnet4.6已经能满足90%以上的任务,剩下的疑难杂症再实用opus解决。

实操方法

# 切换模型
/model sonnet

# 或启动时指定
claude --model sonnet

第二条:控制上下文在 60% 以下

上下文长度加大,会导致后面每条消耗的token增多。而且上下文的增多简洁来说是AI的负担。

譬如本来你改A的功能,结果把b的对话也放到上下文中,导致了AI的成功率降低。

因此,你需要做的是:

1、控制上下文60%以下
2、每次新的功能,新开窗口。
3、用claude.md来保存记忆,而不是用

第三条:用rules 还是用skills?

这不是一个选择,能用skills

Claude Code 太烧钱了?我用这 5 招,把 token 成本砍了一半!

你电脑定义100条规则,那么每次对话都会加载这100条规则

但是100个skills,可能只会用到1-2个。

要做的就是检查.claude/rules的规则,看看有什么内容,把不常用的移动到skill中。

需要的时候用 /skill xxx来加载。

第四条:依赖图工具减少文件读取

claude读取文件是线性的,很多时候会检索出来不必要的内容。

因此可以用一些工具,把文件读取改成依赖读取。

推荐下面这个几个:

  • vexp
    (VS Code 插件)— 自动建立依赖图(省下70%token)
Claude Code 太烧钱了?我用这 5 招,把 token 成本砍了一半!
  • ast-grep — 结构化代码搜索

  • Serena — 语言服务器包装

第五条:能用max订阅就用max订阅吧!

很少有直接用官方API,大部分都是用第三方API的。

缺点:

1、上下文比较短

2、逆向做的那种偷梁换柱严重。

因此,能用官方的还是用官方吧。注册尼日利亚icloud账号、土耳其账号充值能省下不少钱呢

Claude Code 太烧钱了?我用这 5 招,把 token 成本砍了一半!

写在后面的话

Claude Code 是个好工具,但不会用就是烧钱机器。

我日常的工作流:

默认sonnet,遇到难题切换opus,上下文超过60%,直接new新的对话框。

目前已经用claude做出多个小程序、海外站等内容,很多坑都是一路踩下来的。

RAG技术前沿技术新闻资讯

Claude Cowork 真能替换 RAG ?

2026-4-14 8:00:00

RAG技术前沿技术新闻资讯

当RAG遇上Agent记忆:为什么相似度检索会"塌方"?

2026-4-14 8:53:12

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
购物车
优惠劵
搜索