人工音声を作ろうと思った
なんか自分の人工音声が欲しい!そう思い立ったのが7月の頭でした.
深い理由とかは特になく,なんとなくあったら面白そうということで作ることにしました.
どのようにして人工音声を作るのか
調べてみると色々と人工音声を作る方法があるらしく,代表的なのだと MYCOEIROINKとかCoeFontとかUTAUとかとか…
じゃあこれのどれを使おうかという話なんですが,CoeFontは結構作るの楽そうだな~と思ってたんですが,ブラウザ上での駆動+API(プログラムで扱う方法)が有料ということだったので,ちょっとやりずらいな~とおもったのでパス.
UTAUは話すというよりも歌うなので,今回の目的に沿わないのでパス.
ということで,MYCOEIROINKを使うことにしました.
MYCOEIROINK とは
合成音声で あなたの作品に彩りを
https://coeiroink.com/
というコンセプトで運営されているサービスで,自分で音声合成モデルを作って,他の方が作成した音声合成モデルを探して,それらをダウンロードして使って,というのができるものです.
結構いろんな方が作られていて,結構面白いです.
そしてこのMYCOEIROINKは公式で音声合成モデルを作成する方法をサポート/公開しているので,それを使って今回は作っていきました.
どんな感じで作ったのか
大まかな順番は
- 利用規約を確認する
- 音声を準備する
- 音声をアップロードする
- 音声合成モデル作成プログラムを起動する
- できるのを待つ
- 完成!
という感じです.ちなみにこの中で一番大変だったのは音声を準備するでした.
利用規約を確認する
利用規約を確認することは大事です.絶対に読みましょう.
音声を準備する
一番時間がかかったフェーズです.ひたすら文を読むことになります.
作り方を説明するつもりはないので簡単にどんなことをしたかの説明だけになりますが,ITAコーパスという自然言語の文章が大量に集まったデータベース 424文 と,MANAコーパス を228文 をひたすら読み上げました.
録音ボタンを押して,一文読んで,録音ボタンを押して…の繰り返しです.ただこの録音なんですが,それに適したソフトウェアが公開されていたので思ったよりは楽でした.ただ時間がかかるというだけ.
音声をアップロードする
Google Driveにアップロードしただけ.
音声合成モデル作成プログラムを起動する
MYCOEIROINKがGoogle Colab(ブラウザ上で強いPCを借りてプログラムを実行できるサービス)でプログラムを公開しているので,それを実行しました.
ここで問題なのが,このGoogle ColabのPCの強さ.
このような人工音声系を作成するときは大抵GPUを使うんですが,無料プランと有料プランで使えるGPUが違います.もちろん有料プランの方が使えるPCは強い.そして,無料プランだとめっちゃ時間がかかるうえに上限があるせいで少し違和感のある合成音声モデルになっちゃう…ということで,有料プランを契約しちゃいました.結構安かったし.

2025/08/03 現在の価格
Google Colab Proを1ヵ月だけ契約しました.
使い方によると思いますが,100コンピューティングユニットで全然足りました.
できるのを待つ
結構時間がかかります.
有料プランでのGPUを使っても結構時間がかかります.一晩PCを付けっぱなしにしました(ブラウザ閉じると停止しちゃう).ただまぁブラウザ起動し続けてるだけなので,ノートPCでブラウザ起動してベッドの反対側に向けて睡眠を確保しました.
完成!
学習時間によって出来具合的なのが1~100段階であるんですが,100までできました!
それがこちら
結構私っぽい声じゃないでしょうか.
配布するよ
出来たので配布しちゃいます.
VTuberとかだとワンコメを使えばコメント読み上げに仕えます.
後いろいろ使えると思います!
利用規約はファイルの中にあるので読んで使ってくださいね!