2026年3月3日、Claude Codeに「Voice Mode(ボイスモード)」が追加されました。キーボードを打つ代わりに、スペースキーを押しながら話しかけるだけでAIにコーディング指示が出せる機能です。発表からわずか数時間で70万インプレッションを記録するなど、開発者コミュニティで大きな反響を呼んでいます。本記事ではVoice Modeの仕組みから日本語設定、OS別のセットアップ手順、認識精度を上げるコツ、トラブル対処法まで、初心者にもわかるように丁寧に解説します。
Voice Modeとは——「話しかけてコードを書く」新しい開発体験
Voice Modeは、Claude Codeのターミナル上で/voiceコマンドを入力すると有効になる音声入力機能です。有効化後、スペースキーを長押ししながらマイクに向かって話し、離すと音声がリアルタイムにテキストに変換されてClaude Codeのプロンプトに入力・送信されます。トランシーバー(Push-to-Talk)と同じ操作感で、常時マイクがオンになるわけではないため、独り言や周囲の雑音を拾ってしまう心配はありません。
音声入力とテキスト入力は同一セッション内で自由に切り替えられます。大まかな方針は口頭で指示し、ファイル名や変数名のような正確さが求められる部分はキーボードで入力する——この「音声+テキストのハイブリッド」が現時点で最も実用的な使い方です。
OpenAIのCodexが2026年2月26日に音声入力機能をリリースしたわずか1週間後のタイミングでの発表であり、AIコーディングツールのUI競争が「モデルの賢さ」から「インタラクションの自然さ」へ移行していることを象徴するアップデートです。
Voice Modeの利用条件
Voice ModeはPro、Max、Team、Enterpriseのすべての有料プランで追加料金なしに利用できます。音声の文字起こし(トランスクリプション)に対する追加課金もありません。変換されたテキストがClaude Codeに送信されるため、通常のメッセージと同じ利用枠を消費しますが、音声入力自体の回数制限はありません。無料プランではClaude Code自体が利用できないため、Voice Modeも使えません。
2026年3月3日のリリース時点では全ユーザーの約5%に段階的に展開中でしたが、2026年3月末時点ではほぼ全ユーザーにロールアウトが完了しています。もしまだ使えない場合はClaude Codeを最新バージョンにアップデートしてください。
Voice Modeの始め方——初めての方向けステップバイステップ
ステップ1:Claude Codeを起動する
ターミナルを開き、作業したいプロジェクトフォルダに移動してclaudeと入力します。Claude Codeのインストールがまだの方はClaude Codeとは?の記事を先に確認してください。Claude Codeの使い方入門でも基本操作を解説しています。
ステップ2:/voiceコマンドを入力する
Claude Codeが起動したら、チャット欄に/voiceと入力してEnterを押します。「Voice mode enabled. Hold Space to record. Dictation language: en (/config to change).」と表示されれば成功です。このメッセージの最後にある「Dictation language: en」は「現在の認識言語が英語」という意味です。日本語で使いたい場合は次のステップ3の設定が必須です。
もし「Unknown skill: voice」と表示された場合は、Claude Codeのバージョンが古い可能性があります。ターミナルでclaude updateを実行して最新版にアップデートしてください。
ステップ3:日本語設定に変更する(最重要ステップ)
デフォルトの言語設定が英語のため、そのまま日本語で話しかけても「No speech detected.(音声が検出されませんでした)」と表示されたり、「Ohio was a must」のような意味不明な英語に変換されたりします。日本語で使うには以下の手順で言語設定を変更してください。
方法Aとして/configコマンドで設定する方法があります。Claude Codeで/configと入力してEnterを押します。設定メニューが表示されるので、下矢印キーで「Language」の項目にカーソルを合わせます。ここで絶対に注意すべき点があります。Enterキーではなく、Spaceキーを押してLanguageの設定画面に入ってください。Enterを押すとconfigメニュー自体が閉じてしまいます。Language設定画面が開いたら「Japanese」と入力します。画面に「language Japanese」と表示され、下部に「Enter to save」と出ます。ここで必ずEnterキーを押して保存してください。「Enter to save」が表示されている状態でEscキーを押すと設定が保存されずに閉じてしまいます。この「保存し忘れ」が最も多いつまずきポイントです。
方法Bとして設定ファイルを直接編集する方法があります。テキストエディタで~/.claude/settings.jsonを開き、以下の行を追加してください。「”language”: “japanese”」——これだけです。ファイルを保存したら、Claude Codeを再起動するか、再度/voiceを実行してください。「Dictation language: ja」と表示されれば日本語設定が完了です。
ステップ4:スペースキーを押しながら話す
日本語設定が完了したら、スペースキーを押し続けながらマイクに向かって話します。話し終わったらスペースキーを離すだけ。音声がテキストに変換されてClaude Codeに送信されます。最初は「このプロジェクトの構造を説明して」のような簡単な指示から試してみてください。音声モードを終了するには再度/voiceと入力するか、Ctrl+Cで中断します。
Claude活用プロンプト集50選(無料PDF)
メール作成・データ分析・コーディング…すぐ使える実践プロンプト50個を1冊にまとめました。【】を書き換えるだけでそのまま使えます。
OS別のセットアップと注意点
macOSの場合
macOSではシステムのマイク権限をターミナルアプリに付与する必要があります。「システム設定」→「プライバシーとセキュリティ」→「マイク」を開き、使用しているターミナルアプリ(Terminal.app、iTerm2、Warp等)にチェックを入れてください。権限を付与した後、ターミナルを再起動する必要がある場合があります。MacBookの内蔵マイクでも動作しますが、外付けマイクやAirPodsを使うと認識精度が向上します。
Linuxの場合
Linuxでは音声関連のパッケージが必要です。Ubuntuの場合は「sudo apt install -y ffmpeg portaudio19-dev pulseaudio」でインストールします。Fedoraの場合は「sudo dnf install ffmpeg portaudio-devel pulseaudio」を使います。インストール後、PulseAudioが正しく動作しているか「pactl info」コマンドで確認してください。マイクデバイスが認識されていない場合は「pavucontrol」(PulseAudio音量コントロール)で入力デバイスの設定を確認します。
Windows(WSL2)の場合
WindowsではWSL2(Windows Subsystem for Linux 2)経由でClaude Codeを使うため、WSL2内でPulseAudioのインストールが必要です。WSL2ではホストOS(Windows側)のオーディオデバイスにアクセスするためのブリッジ設定が追加で必要になる場合があります。WSL2でのマイクアクセスがうまくいかない場合は、PulseAudioの設定ファイル(/etc/pulse/default.pa)を確認してください。Windows側のマイク権限設定(設定→プライバシーとセキュリティ→マイク)も合わせて確認が必要です。
音声認識の精度を上げる7つのコツ
コツ1:アクション(何をしたいか)を最初に言う
「このファイルのエラーハンドリングを改善して」のように、動詞(やりたいこと)を冒頭に持ってくるとClaude Codeの理解精度が上がります。長い背景説明を先にして最後に「……というわけで修正して」とまとめるより、「修正して。具体的には……」の順序のほうが正確に処理されます。
コツ2:技術用語は英語で発音する
関数名、変数名、フレームワーク名などの技術用語は英語で発音したほうが認識精度が大幅に上がります。「リファクタリング」より「refactoring」、「オーセンティケーション」より「authentication」です。日本語の指示の中に英語の技術用語を混ぜる「日英混在」スタイルが最も実用的です。例:「authenticationのミドルウェアをrefactoringして、error handlingを追加して」
コツ3:短い指示を繰り返す
1回の音声入力で長い指示を出そうとすると認識精度が下がりがちです。「テストを書いて」→結果を確認→「正常系を3パターン追加して」→確認→「異常系も追加して」のように、短い指示と確認を繰り返すほうが精度が安定し、意図のズレも早期に修正できます。
コツ4:Fast Modeと組み合わせる
Shift+TabでFast Mode(高速応答モード)をオンにすると、Voice Modeとの組み合わせで「話す→即修正→話す→即修正」の超高速イテレーションが実現します。会話するようにコードが進化していく体験はVoice Modeの最大の魅力です。ペアプログラミングのパートナーが24時間いる感覚に近いです。
コツ5:静かな環境で使う
カフェや電車内のような騒がしい環境では認識精度が大幅に下がります。静かな部屋で、できれば外付けマイクやノイズキャンセリング付きヘッドセットを使うと精度が向上します。MacBookの内蔵マイクでも動作しますが、口元から30cm以内の距離を保つことを意識してください。
コツ6:ゆっくり・はっきり話す
早口になると認識精度が下がります。特に日本語の場合、英語よりも認識精度にバラつきがあるため、普段より少しゆっくり、はっきりと発音することを意識してください。文の切れ目では一瞬間を置くと、文字起こしの区切りが正確になります。
コツ7:音声とテキストを使い分ける
すべてを音声で完結させようとする必要はありません。「大まかな方針や設計の説明は音声で、ファイル名・変数名・コマンドの正確な記述はテキストで」というハイブリッド運用が最も効率的です。音声はClaude Codeに「何をしたいか」の意図を伝えるのに向いており、正確なスペルが必要な部分はキーボードのほうが確実です。
claude.aiのボイスモードとの違い
claude.ai(Webブラウザ版やスマホアプリ版)にも「ボイスモード」が存在しますが、Claude Codeの/voiceとは仕組みが異なる別の機能です。違いを整理します。
claude.aiのボイスモードは、Claudeとの「双方向の音声会話」です。ユーザーが話しかけるとClaudeが音声で応答を返します。現時点で英語のみ対応のベータ機能で、日本語には対応していません。settings.jsonのlanguage設定も効きません。
一方、Claude Codeの/voiceは「音声→テキスト変換→プロンプトに入力」する一方向の機能です。Claudeの応答はテキストで表示されます。/configでLanguageをJapaneseに設定すれば日本語で利用可能です。
つまり「Claudeと日本語で音声会話したい」場合はClaude Codeの/voiceを使い、「Claudeと英語で双方向の音声対話をしたい」場合はclaude.aiのボイスモードを使う——という使い分けになります。
VoiceMode MCP——双方向音声会話の選択肢
ネイティブの/voiceとは別に、「VoiceMode」というMCPサーバーを導入することで、Claude Codeとの双方向音声会話(こちらが話す→Claudeが音声で応答する)を実現する方法もあります。Whisper(音声認識)とKokoro(音声合成)をローカルで実行する仕組みで、「uvx voice-mode-install」でインストールし、「claude mcp add –scope user voicemode — uvx –refresh voice-mode」でClaude Codeに追加します。
ただしWhisperとKokoroのローカル実行にはそれなりのマシンリソース(CPU/GPU)が必要で、セットアップの難易度もネイティブ/voiceより高いです。「日本語で指示を出す」だけならネイティブ/voiceで十分であり、VoiceMode MCPは「双方向音声対話でハンズフリー開発を追求したい」上級者向けの選択肢です。
OpenAI Codexの音声機能との比較
OpenAIのCodexは2026年2月26日にv0.105.0で音声入力機能をリリースしています。両者を比較すると、操作方式はどちらもPush-to-Talk方式でほぼ同じです。ただしCodexの音声機能は実験的段階で設定ファイルを手動で編集して有効化する必要があった一方、Claude Codeの/voiceはネイティブ対応として展開されており、/voiceコマンド一つで有効化できる手軽さで優位性があります。言語対応はCodexが英語中心、Claude Codeは/configで日本語を含む多言語設定が可能です。
よくある質問
Voice Modeは無料プランでも使えますか
いいえ。Claude Code自体がPro以上の有料プラン(月額20ドル〜)が必要で、Voice Modeもその一部として提供されます。有料プラン内でのVoice Modeの追加料金はかかりません。料金プラン比較はこちら。
/voiceと打っても反応しない場合は
まずClaude Codeを最新バージョンにアップデートしてください(ターミナルでclaude update)。それでも反応しない場合はOS別のセットアップ(マイク権限、音声パッケージ)を確認してください。特にmacOSではターミナルアプリへのマイク権限付与を忘れがちです。
音声入力の内容はAnthropicに送信されますか
音声はローカルでテキストに変換された後、通常のテキストプロンプトとしてAnthropicのAPIに送信されます。音声データそのものが保存・送信されるわけではありません。セキュリティの詳細はこちら。
Voice Modeはプログラマー以外でも使えますか
はい。Claude Codeはコーディング以外のタスク(ファイル整理、データ変換、テキスト処理等)にも使えるため、Voice Modeも同様に非プログラマーが音声で指示を出す用途で活用できます。非エンジニア向けガイドとバイブコーディングも参照してください。
まとめ——Voice Modeで開発の「入力体験」が変わる
Voice Modeの使い方は「/voiceと打って、/configで日本語に設定して、スペースキーを押しながら話す」——この3ステップだけです。キーボードから手を離してAIに話しかけてコードを書く体験は、開発の常識を変えるものです。まずは「このファイルの構造を説明して」から試してみてください。Fast Modeとの組み合わせで「話す→即修正」の爆速イテレーションが体験できます。
関連記事
Claude導入・AI活用について相談する
株式会社仁頼|8年超の実務経験
Claudeを業務にどう活かせるかわからない、導入したいが社内に詳しい人がいない。そんな段階からお気軽にご相談ください。最適なプラン選定から社内研修まで一貫でサポートします。