Raspberry PiでVOICEVOXに可愛くしゃべってもらおう
無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア. Contribute to VOICEVOX/voicevox_core development by creating an account on GitHub.
Releases · VOICEVOX/onnxruntime-builderVOICEVOX COREで利用するonnxruntimeのビルドを行うリポジトリ. Contribute to VOICEVOX/onnxruntime-builder development by creating an account on GitHub.
必要パッケージをインストール sudo apt update sudo apt install -y python3-pip sudo apt install -y git sudo apt install -y cmake sudo apt install -y libgomp1 sudo apt install -y libsndfile1 sudo apt install -y libatlas-base-devRasbperry Pi OSの初期インストール状態から、上記コマンド実行で必要パッケージはすべてインストールできると思います。
VOICEVOX CORE リリース版ファイルをダウンロード cd ~/ wget https://github.com/VOICEVOX/voicevox_core/archive/refs/tags/0.11.4.zip unzip 0.11.4.zip cd voicevox_core-0.11.4/ mkdir release cd release wget https://github.com/VOICEVOX/voicevox_core/releases/download/0.11.4/core.zip unzip -j core.zip上記の例では $HOMEディレクトリ配下 にVOICEVOX用のディレクトリを展開しています。インストール先ディレクトリは好きな場所に変更していただいても問題ありません。
Raspberry Pi用の ONNX runtime を指定し VOICEVOX CORE をインストールRaspberry Pi OSの種類で「32bit OS」 と 「64bit OS」 ごとにコマンドが異なります。
32bit OSの場合
cd ~/voicevox_core-0.11.4/ python configure.py --ort_download_link https://github.com/VOICEVOX/onnxruntime-builder/releases/download/1.10.0.1/onnxruntime-linux-armhf-cpu-v1.10.0.tgz pip install -r requirements.txt pip install .64bit OSの場合
cd ~/voicevox_core-0.11.4/ python configure.py --ort_download_link https://github.com/VOICEVOX/onnxruntime-builder/releases/download/1.10.0.1/onnxruntime-linux-arm64-cpu-v1.10.0.tgz pip install -r requirements.txt pip install .ONNX(Open Neural Network Exchange)はニューラルネットワークなどの学習済みモデルの実行エンジンです。Raspberry Pi用にビルドされたものを指定し組み込みます。
インストール時に以下のように選択を求められますので 環境に合わせ数字を入力しEnterキーを入力 。ここでは32bit OSの例として libcore_cpu_armhf.so の番号である 3 を選択しています。
Please enter number to select which library to use.0: /home/yoshiyuki/voicevox_core-0.11.4/release/libcore_cpu_arm64.so1: /home/yoshiyuki/voicevox_core-0.11.4/release/libcore_gpu_x64_nvidia.so2: /home/yoshiyuki/voicevox_core-0.11.4/release/libcore_cpu_x64.so3: /home/yoshiyuki/voicevox_core-0.11.4/release/ libcore_cpu_armhf.so
Your choice: 3 Successfully configured!
32bit OSの場合は libcore_cpu_ armhf. so の番号を入力してEnterキーを押す64bit OSの場合は libcore_cpu_ arm64 .so の番号を入力してEnterキーを押す(番号はセットアップするOSごとに何故か並びが変わるので要確認)
ラズパイの寿命を伸ばすために/tmpをRAMDISK化している場合、/tmp容量不足でエラーになる場合があります。VOICEVOXのインストールに限った話ではありませんが No space left on device とエラーが出る場合は、環境変数を一時作業場所(Disk)に変更して対処しましょう。
<HOMEディレクトリに一時的なディレクトリtmpを作り作業場所に設定>mkdir ~/tmpexport TMPDIR=~/tmp
上記コマンド実行後に 再度インストールすれば成功 します。~/tmpディレクトリは最後までセットアップが無事に終わった後で削除しておきましょう。
VOICEVOX COREのサンプルプログラムを実行
VOICEVOX COREの実行方法 cd ~/voicevox_core-0.11.4/example/python/ pip install -r requirements.txtサンプルプログラム実行に必要なpyopenjtalkのビルドで 10分程度の時間が掛かります 。気長に待ちましょう。
cd ~/voicevox_core-0.11.4/example/python/ python run.py --text "おはようございます" --speaker_id 2 --root_dir_path="../../release"python run.pyで音声合成処理を実行します。 非力なRaspberry Piでは1~2分程度かかる と思います。カレントディレクトリに「おはようございます-2.wav」という音声ファイルが作成されていれば音声合成は成功です!
VOICEVOX COREで出力される音声ファイル名は、「text」で指定したテキスト +「speaker_id」で指定されたid の名称で作成されます。
それでは、ラズパイ標準で入っているaplayコマンドを使って「 ラズパイに可愛く喋ってもらいましょう! 」ラズパイのイヤホンジャックにスピーカーをつないで以下コマンドを実行してみてください。
aplay おはようございます-2.wav python run.py --text "おはようございます" --speaker_id 2 --root_dir_path="../../release" # 引数の紹介 # --text 読み上げるテキスト # --speaker_id 話者ID # --root_dir_path [metas.json]ファイルが置いてあるパスを指定 # --f0_speaker_id 音高の話者ID(デフォルト値はspeaker_id) # --f0_correct 音高の補正値(デフォルト値は0。+-0.3くらいで結果が大きく変わります)--speaker_idで喋らせたいキャラクタの話者IDを指定します。例えば「 四国めたんのツンツン声 」で ガッツリ責められたい時 は以下のように使います。
python run.py --text "あたなは本当にクズでダメな人間ですね" --speaker_id 6 --root_dir_path="../../release" VOICEVOX 話者ID一覧 話者話者ID四国めたん:ノーマル2四国めたん:あまあま0四国めたん:ツンツン6四国めたん:セクシー4 話者話者IDずんだもん:ノーマル3ずんだもん:あまあま1ずんだもん:ツンツン7ずんだもん:セクシー5 話者話者ID春日部つむぎ:ノーマル8 話者話者ID雨晴はう:ノーマル10 話者話者ID 波音 リツ:ノーマル9 話者話者ID玄野武宏:ノーマル11 話者話者ID白上虎太郎:ノーマル12 話者話者ID青山龍星:ノーマル13 話者話者ID冥鳴ひまり:ノーマル14 話者話者ID九州そら:ノーマル16九州そら:あまあま15九州そら:ツンツン18九州そら:セクシー17九州そら: ささやき 19VOICEVOX COREにより作成した音声を評価
読み方やアクセント辞書は未設定(素の状態)での音声合成結果です。かなりリアルな発音になっていると思います。 しかも可愛い声がたくさん用意されています 。例としてサンプルを置きますのでぜひ聞いてみてください。
VOICEVOXの音声(春日部つむぎ、ずんだもん、四国めたん) VOICEVOX 春日部つむぎ(ノーマル) VOICEVOX ずんだもん(ノーマル) VOICEVOX 四国めたん(ノーマル) Open JTalk (MMDAgent Model) "Mei"さんの音声我が家で6年ほど秘書として喋っていただいているOpen JTalkのMeiさんによる音声も比較のために置いておきます。 Raspberry Piでリアルタイム用途で音声合成 して喋らせるならOpen JTalkのMeiさんで決まりだと思っています。
Open JTalk(MMDAgent Model )メイ- VOICEVOXの音声は自然でとてもかわいい!
- Rapsberry Piではリアルタイム処理は正直キツイ(ラズパイ4 64bitでもキツイ)
- 天気予報、家族への音声インフォーメーション等で 非同期で事前処理させる用途がベスト !
九州そらさんのささやきボイスは… ASMRとかバイノーラル録音?ってくらいリアルです 。音声合成に耳元で囁いていただける時代がくるとは・・・日本の技術力恐るべし。
VOICEVOX 九州そら(ささやき)我が家では Intel Neural Compute Stick 2 (NCS2) をラズパイUSBに接続しAI処理をさせています。NCS2にも対応頂けるとエッジコンピューティングとして面白い活用ができるかも。…と期待しつつも、別GPU付きマシンにVOICEVOXを入れ、 ラズパイからAPIでコールするようにしました(逃) 。やっぱり、リアルタイムにいろいろなことを喋らせたい!(そして可愛く)
記事の誤り指摘やコメント等がありましたらお気軽にこちらまで コメントをキャンセル 関連記事 Raspberry Pi で Nintendo Switch を自動化!単純作業を効率化しちゃおう 【ラズパイ在庫チェッカー】ネットショップの在庫/価格をリアルタイムに確認しよう Intel Neural Compute Stick2(NCS2)を使ってラズパイをドーピング AIマシンとして活用しよう 【初心者必見】ラズパイ初期設定の極意!長寿命化して長期安定稼働させるインストール方法を紹介 Windows/Macに入れたVOICEVOXをPython経由で使う方法Raspberry Pi で Nintendo Switch を自動化!単純作業を効率化しちゃおう
【ラズパイ在庫チェッカー】ネットショップの在庫/価格をリアルタイムに確認しよう ラズパイでイケてるスマートリモコンを作ろう!赤外線制御で家電のIoT化 Midjourneyの使い方!AIに可愛い(kawaii)を理解させよう! Stable Diffusion「呪文詠唱」パターン集!見習い召喚士必見! Stable Diffusionをローカル環境のラズパイで動かす方法(苦行)- 必要なもの
- Raspberry Pi OS への VOICEVOX CORE インストール
- 必要パッケージをインストール
- VOICEVOX CORE リリース版ファイルをダウンロード
- Raspberry Pi用の ONNX runtime を指定し VOICEVOX CORE をインストール
- VOICEVOX COREの実行方法
- VOICEVOX 話者ID一覧
- VOICEVOXの音声(春日部つむぎ、ずんだもん、四国めたん)
- Open JTalk (MMDAgent Model) "Mei"さんの音声