公司月耗 1000 刀 token 怎么省？换模型就能省一大截 | 山月的琐碎博客记录

有群友提问，在公司用 token 用得太猛，一个月花了 1500 美元，被问为什么会花这么多，有什么节省 token 费用的办法吗？

首先，对他被批评表达同情，并对他可以无限使用 Opus 表达羡慕。

其实不用砍用量，换一下模型选择就能省不少。

1 先看模型档位。

他一直在用 Opus 4.6。很多日常需求用 Sonnet 4.6 就够用了，不必上 Opus。Sonnet 每百万 token 3 美元，Opus 是 5 美元，同样用量直接省 40%。只有任务确实复杂、需要更强推理时，再切到 Opus。

2 再看场景。

比如读代码、看代码库这种活，可以交给 GPT Codex 5.3。这个模型更便宜，每百万 token 只要 1.75 美元，专门做代码相关的事很合适。

除了切换模型，还有最重要的一点是：单一职责。一个 chat/thread 只做一件事。就像 git commit 那样。

这样上下文干净，不会被前面的话题带偏，回答质量更高，费用也不会莫名飙上去。这条主要是为了更好质量，省 token 是附带的。

按「一般用 Sonnet、复杂用 Opus、读代码用 Codex」再配上「一个对话只干一件事」，每个月 token 费用能降下来，回答也会更稳。

#全栈成长之路