Readie.

佈建系列 · 成本與用量

成本與用量管理

Claude Code 按 token 計費。企業導入前最該先回答的問題是「一個月會花多少、怎麼控、怎麼看」。參考值:企業部署平均約每位開發者每活躍日 13 美元、每月 150–250 美元。這頁講怎麼看、怎麼降、怎麼管。

對象:要管 AI 預算的決策者/IT

SECTION 01先看得到:用量指令

/usage 看本機 session 的 token 與配額分布,還會把用量歸因到 skills、subagents、MCP 等各來源。權威帳單以 Claude Console 的 Usage 頁為準。

bash
/usage     # 看 session 用量與配額 breakdown(按 d/w 切 24h / 7 天)
/context   # 看目前 context 被什麼佔用(找肥的來源)
/model     # 切模型:Sonnet 日常、Opus 難題、Haiku 雜務

SECTION 02降成本的做法

成本隨 context 大小走。把 context 維持精簡,是最直接的省錢手段。

  • 選對模型:Sonnet 處理多數任務、成本低於 Opus;難的架構才用 Opus;subagent 雜務指定 model: haiku
  • 勤用 /clear:切換不相關工作時清空,舊 context 會在每則訊息持續燒 token。
  • 用 plan mode:複雜任務先規劃再動手,避免走錯方向的昂貴重工。
  • 流程移到 Skills:CLAUDE.md 每次全載入,把長流程改成按需載入的 skill 可顯著縮小基礎 context(CLAUDE.md 控制在 200 行內)。
  • Hooks 先過濾:例如把 10000 行 log 先 grep 成幾百行再給 AI。
  • verbose 操作丟 subagent:跑測試、抓文件的大量輸出留在子代理 context,主對話只收摘要。

SECTION 03團隊治理:上限、配額、監控

走 Claude API 計費時,可在 Console 對 Claude Code 的 workspace 設花費上限與成本報表;Pro/Max 可用 /usage-credits 設每月上限。建議的 per-user rate limit:

團隊規模TPM / 人RPM / 人
1–5 人200k–300k5–7
5–20 人100k–150k2.5–3.5
20–50 人50k–75k1.25–1.75
50–100 人25k–35k0.62–0.87

用 OpenTelemetry 監控用量

把用量/成本指標匯到你的監控系統(Grafana、Datadog…),做全隊儀表板。

json
{
  "env": {
    "CLAUDE_CODE_ENABLE_TELEMETRY": "1",
    "OTEL_METRICS_EXPORTER": "otlp",
    "OTEL_EXPORTER_OTLP_ENDPOINT": "http://你的collector:4317"
  }
}
小團隊提醒

先用一小組做 pilot、用 /usage 建立基準,再決定全面推行的預算與 rate limit。自動化(見 無頭執行)會增加用量,記得納入估算。

把工具變成戰力

佈建好環境,只是開始。
讓全公司真的用同一套,才是價值。

Readie 幫台灣中小企業把 AI 從「裝好了」帶到「天天在用、人人一致」——不換系統、不買新軟體,從你們每天已經在用的工具與一台 Mac Mini 開始。

Readie AI 導入顧問 · 創辦人 Marco Liu · 19 年產業經驗