打字很好用,但有時候你就是想用說的。OpenClaw 透過多種方式支援語音互動 — 從 Telegram 語音訊息到帶有喚醒詞的完整對話模式。
語音選項概覽
| 方式 | 設定難度 | 費用 | 最適合 |
|---|---|---|---|
| Telegram 語音訊息 | 無 | 免費 | 快速語音筆記 |
| 對話模式(瀏覽器) | 簡單 | TTS/STT 的 API 費用 | 免手動聊天 |
| 電話通話 | 中等 | 電信業者費用 | 外出時使用 |
| iOS/Android 應用程式 | 困難 | 免費(本地端) | 行動語音助理 |
方式一:Telegram 語音訊息(最簡單)
最簡單的語音互動完全不需要設定。只要在 Telegram 上對你的 OpenClaw 機器人發送語音訊息即可。
運作方式:
- 在 Telegram 中開啟你的機器人
- 按住麥克風按鈕說話
- OpenClaw 接收音訊、轉錄內容,並以文字回覆
優點: 立即可用,不需要額外設定 缺點: 回覆僅限文字(無語音回覆)
這適用於任何 OpenClaw 設定,包括 ClawTank。
方式二:對話模式(瀏覽器版)
對話模式將 OpenClaw 變成瀏覽器中的對話式語音助理 — 就像與你的 AI 進行視訊通話一樣。
組成元件:
- STT(語音轉文字): 將你的語音轉換為文字(Whisper)
- TTS(文字轉語音): 將 AI 回覆轉換為語音(ElevenLabs、OpenAI TTS)
- 持續循環: 聆聽 → 思考 → 說話 → 聆聽
設定步驟:
- 在 OpenClaw 設定中啟用 TTS:
openclaw config set tts.provider "elevenlabs"
openclaw config set tts.apiKey "YOUR_ELEVENLABS_KEY"
- 啟用 STT:
openclaw config set stt.provider "openai"
- 透過瀏覽器中的 OpenClaw Control UI 進入對話模式。
優點: 完整語音對話、免手動 缺點: 需要瀏覽器、額外的 API 費用
方式三:電話通話
沒錯,你可以用實際的電話號碼打給你的 OpenClaw 助理。
運作方式: OpenClaw 透過 Voice Call 外掛整合電信業者(Plivo、Twilio、Telnyx)。你撥打一個號碼,你的 AI 助理就會接聽。
設定概覽:
- 註冊一個電信業者帳號(Twilio 最受歡迎)
- 取得一個電話號碼
- 安裝語音通話外掛:
openclaw plugins install voice-call
- 使用你的業者憑證進行設定
- 撥打你的號碼,開始對話
優點: 從任何手機、任何地方都能使用 缺點: 電信費用、設定較複雜、有些延遲
方式四:行動語音助理
iOS
iOS 應用程式原生支援語音聊天。與你的 Gateway 配對後,你可以直接從 iPhone 進行語音對話。
Android
Android 版 OpenClaw Assistant 應用程式功能包括:
- 可自訂喚醒詞
- 長按 Home 鍵啟動
- 持續對話模式
- 離線喚醒詞偵測
優點: 手機上隨時可用的語音助理 缺點: 需要從原始碼編譯、Gateway 必須持續運行
選擇 TTS 語音
你的助理使用什麼語音很重要。選項:
- ElevenLabs — 最自然的聲音、多種語音選項、每月 $5 起
- OpenAI TTS — 品質不錯、設定簡單、按使用量付費
- 本地端(Piper) — 免費、在你的伺服器上運行、不太自然但零延遲
對大多數使用者來說,ElevenLabs 提供最佳體驗。
ClawTank 上的語音功能
目前,ClawTank 支援透過 Telegram 進行文字互動,包括 Telegram 語音訊息(會自動轉錄)。
完整對話模式和電話通話功能在開發路線圖上。在此期間,Telegram 語音訊息提供了開箱即用的良好語音轉文字體驗。
實用建議
從 Telegram 語音訊息開始 — 它是免費的、不需要設定、而且現在就能用。如果你發現自己想要語音回覆,請在 OpenClaw 設定中加入 ElevenLabs TTS。
完整語音助理模式(喚醒詞、持續對話)功能強大但設定複雜。先熟悉文字互動體驗再說。
