有群友提问,在公司用 token 用得太猛,一个月花了 1500 美元,被问为什么会花这么多,有什么节省 token 费用的办法吗?
首先,对他被批评表达同情,并对他可以无限使用 Opus 表达羡慕。
其实不用砍用量,换一下模型选择就能省不少。
1 先看模型档位。
他一直在用 Opus 4.6。很多日常需求用 Sonnet 4.6 就够用了,不必上 Opus。Sonnet 每百万 token 3 美元,Opus 是 5 美元,同样用量直接省 40%。只有任务确实复杂、需要更强推理时,再切到 Opus。
2 再看场景。
比如读代码、看代码库这种活,可以交给 GPT Codex 5.3。这个模型更便宜,每百万 token 只要 1.75 美元,专门做代码相关的事很合适。
除了切换模型,还有最重要的一点是:单一职责。一个 chat/thread 只做一件事。就像 git commit 那样。
这样上下文干净,不会被前面的话题带偏,回答质量更高,费用也不会莫名飙上去。这条主要是为了更好质量,省 token 是附带的。
按「一般用 Sonnet、复杂用 Opus、读代码用 Codex」再配上「一个对话只干一件事」,每个月 token 费用能降下来,回答也会更稳。
#全栈成长之路