もっと詳しく

<p>【特集】 音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた</p><p>音声合成ソフトの進化がすごい!無料で使えるVOICEVOXや有料のVOICEPEAKを試してみた #音声合成ソフト</p><p>コンピュータが人間の言葉を音声で発する音声合成。テキストをスピーチに変換するという意味で「TTS(Text to Speach)」と呼んだり、「入力文字読み上げソフト」といった表現をすることもあるが、この音声合成の世界がこの1~2年で大きく発展を遂げている。</p><p>ちなみに「VAIO SX14」(バイオ エスエックス ジュウヨン)は固有名詞ではあるものの「VAIO」という言葉を知っているようでスムーズに読んでくれる。ただ、必要あれば固有名詞などを辞書登録することが可能で、その読み方やイントネーションを指定することも可能になっている。 固有名詞の辞書登録 またカッコについては微妙な間合いでの間隔を空けて読み飛ばしている。これは句読点などにおいても同様で、必要の応じて間隔の長さを調整することも可能だ。どうしても「カッコ」「カッコトジ」と読ませたいのであれば、そのようにカタカナを入力することになる。 カッコについては、カッコそのものは読まず、間隔を空けてカッコ内の文字を読む 画面下には長さ調整のエディタのほか、アクセント調整、イントネーション調整のエディタを表示させることが可能。通常は特に何もしなくても、先ほどのように喋らせることができるが、必要に応じてこれらを動かすことで、より求める発音にすることが可能になる。 アクセントを調整 また画面右側では、読むスピード(速さ)や、声の高さ(ピッチ)などを調整できるほか、幸せ、楽しみ、怒り、悲しみの4つのパラメータがあるので、これらを動かすことでも、かなりニュアンスを変えることが可能。 うまくできたら、メニューから出力を選び、WAVファイルもしくはFLACファイルで書き出すことができるようになっている。この際サンプリングレートを44.1kHz、48kHz、96kHzから選ぶことも可能。必要に応じてブロックごとに分割して保存することもできる。 音声はWAVかFLACファイルで出力 続いてVOICEVOXを見てみよう。これはオープンソースのフリーウェアという形のソフトになっているので、誰でも無料で入手可能。ダウンロードする際、Windows、Mac、Linuxのいずれかを選択するとともに、GPU/CPUモードか、CPUモードかを選べるのもVOICEVOXの特徴。GPUとしてはNvidia製のGPUが必要となるが、GPUを使った方がより負荷が軽く快適に使えるようになっている。 このソフトは、現在ドワンゴの社員でもあるヒロシバ氏が、個人の立場で開発し、公開しているもの。貢献者リストを見るとヒロシバ氏のほかにも多くの人の名前が並んでいるので、まさにオープンソースとして色々な人が開発に加わっているようだ。 また、2022年4月現在VOICEVOXは0.11.4というバージョンになっているが、ここには四国めたん、ずんだもん、春日部つむぎ、雨晴はう、波音リツ、玄野武宏、白山虎太郎、青山龍星、冥鳴ひまり、九州そらの計9つのキャラクタがあり、キャラクタによってはノーマル、あまあま、ツンツン、セクシーなど複数の声が用意されているといった格好だ。 VOICEVOXでは音声が豊富でキャラクター付けされている</p>