auの日記

プログラミング初心者の日記。(auはハンドルネームです)

Open JTalkについて調べてみた

auです。

以前の記事で、Macでゆっくりボイスを喋らせることができるのかどうかを調べてみました。

program-shoshinsya.hatenablog.com

合成音声を作成するソフトで「Open JTalk」というものもあるようなので調べてみました。

open-jtalk.sourceforge.net

Open JTalkとは

Open JTalkとは、「AquesTalk」と同じく、テキストを入力すると、合成音声を作成してくれるソフトです。どうやらtxtファイルをwavへ変換してくれるみたいです。ffmpegとかと合わせればmp3への変換とかもできそうですね。

LinuxMacで使用することができるパッケージがあり

sudo apt-get install open-jtalk open-jtalk-mecab-naist-jdic hts-voice-nitech-jp-atr503-m001
brew install open-jtalk

でそれぞれインストールすることができます。



テキストを喋るための「音響モデル」が必要らしく、外部からダウンロードするみたいですね。

これを調べてみて面白かったのが、なんと「初音ミク」の音響モデルがあるみたいです。

詳しくはこちらの記事を読んでみてください。分かりやすかったです。

karaage.hatenadiary.jp

もう1つ驚いたのが、Pythonを使って開発することができるという点です。

こちらの記事を読ませていただきました。

qiita.com

初音ミクの音響モデルをPythonでいじることができるとなると、なんだかワクワクしますね・・・色々なことができそう。




こんな感じで軽くですが、調べてみると合成音声を作成するソフトもたくさんありますね。

現在も更新されているみたいで、最近の記事もちらほらと見かけました。

3D警備員といったものも生まれているらしく、AI技術と合成音声はどんどん進化するのかもしれませんね。

www.itmedia.co.jp