Open JTalkについて調べてみた
auです。
以前の記事で、Macでゆっくりボイスを喋らせることができるのかどうかを調べてみました。
program-shoshinsya.hatenablog.com
合成音声を作成するソフトで「Open JTalk」というものもあるようなので調べてみました。
Open JTalkとは
Open JTalkとは、「AquesTalk」と同じく、テキストを入力すると、合成音声を作成してくれるソフトです。どうやらtxtファイルをwavへ変換してくれるみたいです。ffmpegとかと合わせればmp3への変換とかもできそうですね。
sudo apt-get install open-jtalk open-jtalk-mecab-naist-jdic hts-voice-nitech-jp-atr503-m001
brew install open-jtalk
でそれぞれインストールすることができます。
テキストを喋るための「音響モデル」が必要らしく、外部からダウンロードするみたいですね。
これを調べてみて面白かったのが、なんと「初音ミク」の音響モデルがあるみたいです。
詳しくはこちらの記事を読んでみてください。分かりやすかったです。
もう1つ驚いたのが、Pythonを使って開発することができるという点です。
こちらの記事を読ませていただきました。
初音ミクの音響モデルをPythonでいじることができるとなると、なんだかワクワクしますね・・・色々なことができそう。
こんな感じで軽くですが、調べてみると合成音声を作成するソフトもたくさんありますね。
現在も更新されているみたいで、最近の記事もちらほらと見かけました。
3D警備員といったものも生まれているらしく、AI技術と合成音声はどんどん進化するのかもしれませんね。