OpenClaw 最大的持續性開支是 AI API 使用費。重度使用者光是 Token 就可能每月花費 $100-300。以下是如何在不明顯影響品質的情況下,最多省下 80% 的方法。
你的錢花在哪裡
你傳送給 OpenClaw 的每一則訊息都會觸發一次對 AI 供應商的 API 呼叫。費用取決於:
- 模型選擇 — Opus 每個 Token 的費用大約是 Haiku 的 10 倍
- 對話長度 — 更長的上下文 = 每則訊息消耗更多 Token
- 回覆長度 — 冗長的回覆花費更多
- 使用頻率 — 更多訊息 = 更多 API 呼叫
- Skills — 某些 Skills 會產生額外的 API 呼叫
策略一:選擇正確的模型
這是影響費用最大的一個因素:
| 模型 | 相對費用 | 最適合用途 |
|---|---|---|
| Claude Opus 4.6 | $$$$$ | 複雜推理、重要任務 |
| Claude Sonnet 4.5 | $$$ | 日常使用,品質與費用的最佳平衡 |
| Claude Haiku 4.5 | $ | 快速回覆、簡單任務 |
| GPT-4.1 | $$$$ | Opus 的替代方案 |
| GPT-4.1 Mini | $$ | 經濟實惠的替代方案 |
| Gemini 2.5 Flash | $ | 大量使用時最便宜的選擇 |
建議: 將 Sonnet 4.5 設為預設模型。它比 Opus 便宜約 5 倍,但在大多數任務上仍有 80-90% 的品質。
更改模型的方式:
openclaw config set ai.model "anthropic/claude-sonnet-4-5"
策略二:設定 Token 限制
預設情況下,OpenClaw 不會限制回覆長度。單一則冗長的回覆可能花費簡潔回覆的 10 倍。
設定最大輸出 Token 限制:
openclaw config set ai.maxTokens 1024
對於大多數對話,1024 個 Token(大約 750 個英文字)已經足夠。如果需要更多細節,你隨時可以要求「詳細說明」。
策略三:智慧模型路由
最有效的策略:簡單任務使用便宜的模型,只在需要時才用昂貴的模型。
某些 OpenClaw 設定支援模型路由規則:
- 簡單問題 → Haiku(最便宜)
- 一般對話 → Sonnet(平衡)
- 複雜推理 → Opus(最佳品質)
請確認你的 OpenClaw 版本是否支援智慧路由,或使用像 OpenRouter 這樣的代理服務來自動選擇模型。
策略四:管理對話長度
對話中的每則訊息都會將整段聊天記錄傳送給 AI。一個 50 則訊息的對話,每次新的請求都會傳送相當於 50 則訊息的 Token 量。
建議:
- 換新話題時開啟新對話
- 使用
/clear或/reset重新開始 - 當一則詳細的提示就能解決問題時,避免來回反覆對話
- 在第一則訊息中就寫清楚需求,避免後續的釐清追問
策略五:減少主動訊息
如果 OpenClaw 設定為主動檢查某些項目(新聞、價格、郵件),每次檢查都會消耗 Token。降低頻率:
- 每日簡報:每天一次,而不是每小時一次
- 價格監控:每 6 小時檢查一次,而不是每 30 分鐘
- 郵件篩選:每天分批處理兩次,而不是即時處理
策略六:利用快取
如果你使用 OpenRouter 或其他支援 Prompt 快取的代理服務,請啟用它。重複的上下文(系統提示、記憶)會被快取,後續呼叫的費用會更低。
策略七:監控你的花費
定期檢查你的 AI 供應商儀表板:
- Anthropic: console.anthropic.com → Usage
- OpenAI: platform.openai.com → Usage
- Google: console.cloud.google.com → Billing
設定花費提醒,避免收到意外的帳單。
實際效果
一般使用者從 Opus 切換到 Sonnet 並加上 Token 限制後的變化:
| 調整前 | 調整後 |
|---|---|
| Opus,無限制 | Sonnet,1024 Token 限制 |
| ~$80/月 | ~$15/月 |
| 省下:81% |
日常任務的品質差異?幾乎感覺不到。
最省錢的設定
如果要把費用降到最低:
- 使用 Gemini 2.5 Flash(每百萬 Token 約 $0.15)
- 將 Token 限制設為 512
- 減少主動功能
- 頻繁開啟新對話
估計每月費用:中度使用約 $1-3。
開始使用
在 ClawTank 上部署 OpenClaw,並使用你自己的 API 金鑰。你可以自行控制模型選擇和花費——ClawTank 負責處理基礎架構。
