Skip to content

公司月耗 1000 刀 token 怎么省?换模型就能省一大截

Published: at 00:00

有群友提问,在公司用 token 用得太猛,一个月花了 1500 美元,被问为什么会花这么多,有什么节省 token 费用的办法吗?

首先,对他被批评表达同情,并对他可以无限使用 Opus 表达羡慕。

其实不用砍用量,换一下模型选择就能省不少。

1 先看模型档位。

他一直在用 Opus 4.6。很多日常需求用 Sonnet 4.6 就够用了,不必上 Opus。Sonnet 每百万 token 3 美元,Opus 是 5 美元,同样用量直接省 40%。只有任务确实复杂、需要更强推理时,再切到 Opus。

2 再看场景。

比如读代码、看代码库这种活,可以交给 GPT Codex 5.3。这个模型更便宜,每百万 token 只要 1.75 美元,专门做代码相关的事很合适。

除了切换模型,还有最重要的一点是:单一职责。一个 chat/thread 只做一件事。就像 git commit 那样。

这样上下文干净,不会被前面的话题带偏,回答质量更高,费用也不会莫名飙上去。这条主要是为了更好质量,省 token 是附带的。

按「一般用 Sonnet、复杂用 Opus、读代码用 Codex」再配上「一个对话只干一件事」,每个月 token 费用能降下来,回答也会更稳。

#全栈成长之路