VC ClientをインストールしてRVCボイスチェンジャーを使う

VTuber活動をするにあたり、ボイスチェンジャーとして定番(?)のVC Clientをインストールするので、その手順を2024年版としてメモ程度に残す。

目次

そもそもRVCとは何?

Retrieval-based-Voice-Conversionの略。

中国が開発した、AIを使った声変換ができるもので、特に少ない学習データで声を再現することができるので流行っているらしい。

インストール前の注意

今回は学習で声のモデルデータを作ることはせず、予め声を学習させたモデルデータを導入し、(ほぼ)リアルタイムで声変換できることを目標にする。

インストールするPC環境はCUDAが使えるGeForce RTXシリーズのGPUが搭載されている前提で進めていく。実際にRVCをインストールする際には注意してほしい。

ここでは男性から女性への声変換を前提としています。

あくまでも参考までに。

VC Clientのインストール

VC Clientは、RVCを使ってリアルタイムに音声を変換できるようにするためのもの。

  1. こちらのリンクからMMVCServerSIO_win_onnxgpu-cuda_v.○.○.○.○.zipをダウンロードする
  2. ダウンロードしたファイルを展開する
  3. start_http.batを実行する

○.○.○.○の数字は更新されるたびに増えていく。数字に関わらず、最新の日付のファイルをダウンロードしよう。

start_http.batを実行すると、インターネット上から最新のRVCと学習済モデルがダウンロードされて起動する。

動作確認

まずは初期設定が必要です。こちらを設定しないと声が聞こえません。

  1. 上のキャラクターリストから好きな声を選ぶ
    とりあえずつくよみちゃんでいいよ
  2. キャラクター写真右側にあるTUNEを12~15くらいに設定する
    声が低い方は大きい数字を設定しましょう
  3. キャラクター写真右下にあるCHUNKを192に設定する
  4. キャラクター写真右下にあるEXTRAを8192に設定する
  5. キャラクター写真右下にあるGPUからCPU以外を設定する
  6. キャラクター写真下側にあるAUDIOのinputを使用するマイクに設定する
  7. キャラクター写真下側にあるAUDIOのoutputを使用するスピーカーに設定する
  8. キャラクター写真右側にあるスタートボタンを押す
  9. 5~10秒ほど待ってからマイクに声を入れる

いかがだろうか?これで声が聞こえなかった場合は、トラブルシューティングを参考にしてほしい。

RVC学習済モデルの導入

ここまで来たら声が変換されて楽しくなってくる。さらに楽しむために、他のモデルを入れてみよう。

RVC学習済モデルはBOOTHなどで入手することができる。モデルを使う場合は利用規約に従おう。

  1. 入手したモデルファイル(pthファイル)を適当な場所に展開する
  2. VC Clientを起動する
  3. 上のキャラクターリストの右下にある編集ボタンを押す
  4. blankと書かれている右側にあるアップロードボタンを押す
  5. Modelのファイル選択ボタンから、入手したモデルファイル(pthファイル)を選択する
  6. アップロードボタンを押す
  7. 閉じるボタンを押す
  8. 上のキャラクターリストから追加したモデルを選択する
  9. 動作確認で設定したパラメーターを確認する
    モデルによっては推奨パラメーターが公開されていますので、そちらを参考にしてください。
  10. キャラクター写真右側にあるスタートボタンを押す
  11. 5~10秒ほど待ってからマイクに声を入れる

モデルの声になれたかな?

もしモデルの声に程遠い場合は、TUNEやCHUNK、EXTRAを中心に設定してみよう。

参考までに

ここまでできたら君も美少女だ!おめでとう!ようこそこちら側の世界へ!

この声を使ってDiscordでの通話や配信などをやってみたい方はVirtual Audio Cableなどのソフトが必要になるが、ここでは解説しない。

声の遅延が気になる場合は、下記表を参考にパラメーターを設定してみよう。遅延が小さくなり、より快適にボイスチェンジャーを楽しめるぞ。

GPUChunk + Extra変換後の音声がおかしい場合
NVIDIA GeForce RTX 40-series80 chunk + 16384 extra96 chunk + 16384 extra
NVIDIA GeForce RTX 30-series96 chunk + 16384 extra112 chunk + 16384 extra
NVIDIA GeForce RTX 20-series112 chunk + 16384 extra128 chunk + 16384 extra
NVIDIA GeForce RTX 16-series128 chunk + 8192 extra192 chunk + 8192 extra
NVIDIA GeForce RTX 10-series128 chunk + 8192 extra192 chunk + 8192 extra
AMD Radeon RX 7xxx XT112 chunk + 16384 extra128 chunk + 16384 extra
AMD Radeon RX 6xxx XT128 chunk + 16384 extra192 chunk + 16384 extra
AMD Radeon RX 5xxx XT192 chunk + 8192 extra256 chunk + 8192 extra
AMD Radeon RX 580192 chunk + 8192 extra256 chunk + 8192 extra
AMD Radeon RX 570192 chunk + 8192 extra256 chunk + 8192 extra
AMD Radeon RX 560256 chunk + 8192 extra384 chunk + 8192 extra
参考:https://rentry.co/VoiceChangerGuide#gpu-chart-for-known-working-chunkextra

VC Clientでは、ここでは解説していないパラメーターを調整することでより高品質な変換が期待できる。挑戦してみたい方は調べてみよう。

最後に

これにてVC Clientのインストールは完了です。お疲れ様でした!

最近のAIブームでAIを色々試したいなら、GPUはNVIDIA一択。CUDAが強すぎる。

この記事が気に入ったら
フォローしてね!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

沖縄で生まれ育ち、都会に出て仕事をしている真面目な子。
ゲーム好きが高じてプログラマーになった。
得意なプログラミング言語はC++。

コメント

コメントする

目次