まだ OpenClaw をインストールしていませんか?
パソコンへの影響が心配?ClawTank なら60秒でクラウドデプロイ、ファイルへのリスクゼロ。
タイピングも良いですが、話したい時もあります。OpenClaw は Telegram のボイスメッセージからウェイクワード付きのフルトークモードまで、複数の方法で音声インタラクションをサポートしています。
音声オプションの概要
| 方法 |
セットアップ難易度 |
コスト |
最適な用途 |
| Telegram ボイスメッセージ |
なし |
無料 |
手軽な音声メモ |
| トークモード(ブラウザ) |
簡単 |
TTS/STT の API コスト |
ハンズフリーチャット |
| 電話通話 |
中程度 |
テレフォニープロバイダー料金 |
移動中のアクセス |
| iOS/Android アプリ |
難しい |
無料(ローカル) |
モバイル音声アシスタント |
方法 1:Telegram ボイスメッセージ(最も簡単)
最もシンプルな音声インタラクションはセットアップ不要です。Telegram で OpenClaw ボットにボイスメッセージを送るだけです。
仕組み:
- Telegram でボットを開く
- マイクボタンを長押しして話す
- OpenClaw が音声を受信し、文字起こしして、テキストで回答
メリット: すぐに使える、追加設定不要
デメリット: 回答はテキストのみ(音声での返答なし)
これは ClawTank を含む、あらゆる OpenClaw セットアップで動作します。
方法 2:トークモード(ブラウザベース)
トークモードは OpenClaw をブラウザ内の会話型音声アシスタントに変えます — AI とビデオ通話をするような感覚です。
コンポーネント:
- STT(Speech-to-Text): 音声をテキストに変換(Whisper)
- TTS(Text-to-Speech): AI の回答を音声に変換(ElevenLabs、OpenAI TTS)
- 連続ループ: 聞く → 考える → 話す → 聞く
セットアップ:
- OpenClaw 設定で TTS を有効化:
openclaw config set tts.provider "elevenlabs"
openclaw config set tts.apiKey "YOUR_ELEVENLABS_KEY"
- STT を有効化:
openclaw config set stt.provider "openai"
- ブラウザの OpenClaw Control UI からトークモードにアクセス。
メリット: 完全な音声会話、ハンズフリー
デメリット: ブラウザが必要、追加の API コスト
方法 3:電話通話
はい、実際の電話番号で OpenClaw アシスタントに電話できます。
仕組み:
OpenClaw は Voice Call プラグインを通じてテレフォニープロバイダー(Plivo、Twilio、Telnyx)と統合されています。番号に電話すると、AI アシスタントが応答します。
セットアップ概要:
- テレフォニープロバイダーにサインアップ(Twilio が最も人気)
- 電話番号を取得
- Voice Call プラグインをインストール:
openclaw plugins install voice-call
- プロバイダーの認証情報で設定
- 番号に電話して話し始める
メリット: どこからでもどの電話でもアクセス可能
デメリット: テレフォニーコスト、セットアップがより複雑、若干の遅延
方法 4:モバイル音声アシスタント
iOS
iOS アプリはネイティブに音声チャットをサポートしています。ゲートウェイとペアリングした後、iPhone から直接音声会話ができます。
Android
Android 用 OpenClaw Assistant アプリの機能:
- カスタマイズ可能なウェイクワード
- ホームボタン長押しでの起動
- 連続会話モード
- オフラインウェイクワード検出
メリット: スマートフォンでいつでも利用可能な音声アシスタント
デメリット: ソースからのビルドが必要、ゲートウェイが実行中である必要あり
TTS ボイスの選択
アシスタントが使用する音声は重要です。オプション:
- ElevenLabs — 最も自然な音声、多くの音声オプション、月額 $5+
- OpenAI TTS — 良い品質、シンプルなセットアップ、従量課金
- ローカル(Piper) — 無料、サーバーで実行、やや不自然だがゼロ遅延
ほとんどのユーザーには ElevenLabs が最良の体験を提供します。
ClawTank での音声
現在、ClawTank は Telegram でのテキストインタラクション(Telegram ボイスメッセージの自動文字起こしを含む)をサポートしています。
フルトークモードと電話通話機能はロードマップに含まれています。当面は、Telegram ボイスメッセージがすぐに使える確実な音声→テキスト体験を提供します。
実用的なおすすめ
まずは Telegram ボイスメッセージ から始めましょう — 無料で、セットアップ不要で、今日から使えます。音声での返答が欲しくなったら、OpenClaw 設定に ElevenLabs TTS を追加してください。
フル音声アシスタントモード(ウェイクワード、連続会話)は強力ですがセットアップが複雑です。まずテキストベースの体験に慣れてください。
OpenClaw をデプロイしませんか?
Docker・SSH・DevOps 不要。1分以内でセットアップ。
無料トライアルを始める