Omado/voicevox-mcp-server
Built by Metorial, the integration platform for agentic AI.
Omado/voicevox-mcp-server
Server Summary
Generate speech audio
Synthesize voice using VOICEVOX
Support for Windows and Docker environments
Utilize the VOICEVOX ENGINE
VOICEVOX互換の音声合成サーバー(AivisSpeech / VOICEVOX / COEIROINK) を MCP (Model Context Protocol) 経由で利用するためのサーバーです。 Cursor等でのClaude 3.7を使ったエージェントモードでの音声合成に利用できます。
sudo apt install libsdl2-dev pulseaudio-utils pulseaudio
されたLinux環境/mnt/wslg
へのアクセス権限git clone https://github.com/Dosugamea/voicevox-mcp-server.git
cd voicevox-mcp-server
npm install
.env_example
をコピーして .env
ファイルを作成し、必要に応じて設定を変更します:VOICEVOX_API_URL=http://localhost:50021
VOICEVOX_SPEAKER_ID=1
エディタと別途で下記手順でサーバーを立ち上げてください。
npm run build
npm start
エディタと別途での操作は不要です。 stdioモードで立ち上がるため直接実行することはできません。
mcp.jsonに下記を追記してください。 接続が不安定なため切断されたら再接続してください。
"voicevox": {
"url": "http://localhost:10100/sse"
}
mcp.jsonに下記を追記してください。 (作者環境での動作は確認できていません)
{
"tools": {
"voicevox": {
"command": "cmd",
"args": [
"/c",
"docker",
"run",
"-i",
"--rm",
"-v",
"/mnt/wslg:/mnt/wslg",
"-e",
"PULSE_SERVER",
"-e",
"SDL_AUDIODRIVER",
"-e",
"VOICEVOX_API_URL",
"-e",
"VOICEVOX_SPEAKER_ID",
"your-local-docker-image-name"
],
"env": {
"PULSE_SERVER": "unix:/mnt/wslg/PulseServer",
"SDL_AUDIODRIVER": "pulseaudio",
"VOICEVOX_API_URL": "http://host.docker.internal:50031",
"VOICEVOX_SPEAKER_ID": "919692871"
}
}
}
}
話者IDは使用するVOICEVOXのモデルによって異なります。デフォルトでは「1」(四国めたん)を使用しています。
他の話者IDを使用する場合は、環境変数 VOICEVOX_SPEAKER_ID
を変更してください。
話者IDの一覧は、VOICEVOX ENGINE APIの /speakers
エンドポイントで確認できます。
例: curl http://localhost:50021/speakers
MIT License