所有文章
OpenClaw 語音模式:與你的 AI 助理對話(2026 指南)

OpenClaw 語音模式:與你的 AI 助理對話(2026 指南)

|2 分鐘閱讀

打字很好用,但有時候你就是想用說的。OpenClaw 透過多種方式支援語音互動 — 從 Telegram 語音訊息到帶有喚醒詞的完整對話模式。

語音選項概覽

方式 設定難度 費用 最適合
Telegram 語音訊息 免費 快速語音筆記
對話模式(瀏覽器) 簡單 TTS/STT 的 API 費用 免手動聊天
電話通話 中等 電信業者費用 外出時使用
iOS/Android 應用程式 困難 免費(本地端) 行動語音助理

方式一:Telegram 語音訊息(最簡單)

最簡單的語音互動完全不需要設定。只要在 Telegram 上對你的 OpenClaw 機器人發送語音訊息即可。

運作方式:

  1. 在 Telegram 中開啟你的機器人
  2. 按住麥克風按鈕說話
  3. OpenClaw 接收音訊、轉錄內容,並以文字回覆

優點: 立即可用,不需要額外設定 缺點: 回覆僅限文字(無語音回覆)

這適用於任何 OpenClaw 設定,包括 ClawTank

方式二:對話模式(瀏覽器版)

對話模式將 OpenClaw 變成瀏覽器中的對話式語音助理 — 就像與你的 AI 進行視訊通話一樣。

組成元件:

  • STT(語音轉文字): 將你的語音轉換為文字(Whisper)
  • TTS(文字轉語音): 將 AI 回覆轉換為語音(ElevenLabs、OpenAI TTS)
  • 持續循環: 聆聽 → 思考 → 說話 → 聆聽

設定步驟:

  1. 在 OpenClaw 設定中啟用 TTS:
openclaw config set tts.provider "elevenlabs"
openclaw config set tts.apiKey "YOUR_ELEVENLABS_KEY"
  1. 啟用 STT:
openclaw config set stt.provider "openai"
  1. 透過瀏覽器中的 OpenClaw Control UI 進入對話模式。

優點: 完整語音對話、免手動 缺點: 需要瀏覽器、額外的 API 費用

方式三:電話通話

沒錯,你可以用實際的電話號碼打給你的 OpenClaw 助理。

運作方式: OpenClaw 透過 Voice Call 外掛整合電信業者(Plivo、Twilio、Telnyx)。你撥打一個號碼,你的 AI 助理就會接聽。

設定概覽:

  1. 註冊一個電信業者帳號(Twilio 最受歡迎)
  2. 取得一個電話號碼
  3. 安裝語音通話外掛:
openclaw plugins install voice-call
  1. 使用你的業者憑證進行設定
  2. 撥打你的號碼,開始對話

優點: 從任何手機、任何地方都能使用 缺點: 電信費用、設定較複雜、有些延遲

方式四:行動語音助理

iOS

iOS 應用程式原生支援語音聊天。與你的 Gateway 配對後,你可以直接從 iPhone 進行語音對話。

Android

Android 版 OpenClaw Assistant 應用程式功能包括:

  • 可自訂喚醒詞
  • 長按 Home 鍵啟動
  • 持續對話模式
  • 離線喚醒詞偵測

優點: 手機上隨時可用的語音助理 缺點: 需要從原始碼編譯、Gateway 必須持續運行

選擇 TTS 語音

你的助理使用什麼語音很重要。選項:

  • ElevenLabs — 最自然的聲音、多種語音選項、每月 $5 起
  • OpenAI TTS — 品質不錯、設定簡單、按使用量付費
  • 本地端(Piper) — 免費、在你的伺服器上運行、不太自然但零延遲

對大多數使用者來說,ElevenLabs 提供最佳體驗。

ClawTank 上的語音功能

目前,ClawTank 支援透過 Telegram 進行文字互動,包括 Telegram 語音訊息(會自動轉錄)。

完整對話模式和電話通話功能在開發路線圖上。在此期間,Telegram 語音訊息提供了開箱即用的良好語音轉文字體驗。

實用建議

Telegram 語音訊息開始 — 它是免費的、不需要設定、而且現在就能用。如果你發現自己想要語音回覆,請在 OpenClaw 設定中加入 ElevenLabs TTS。

完整語音助理模式(喚醒詞、持續對話)功能強大但設定複雜。先熟悉文字互動體驗再說。

準備好部署 OpenClaw 了嗎?

不需要 Docker、SSH、DevOps。不到 1 分鐘即可部署。

免費開始使用