合成音声の魅力と可能性

はじめに

以前、RVCの記事を書きましたほまれの家横浜の70(ナオ)です。

【参考】
別人になれる? RVCについて

RVCは自分以外の声を使うものですが、そもそもの合成音声の技術は基本的に自分の声を録音し、動画や配信に使うのが多数です。

今回はその合成音声の用途やこれからの使われ方についてお話します。

近年、合成音声技術の進歩は進んでおり、Youtubeなどの動画配信者や、
病気などで声なくした方にとって、合成音声は革新的なツールとなりました。

合成音声の特徴

合成音声は、人工的に生成された声でありながら、驚くほど自然で生き生きとした表現が可能です。

この技術は、Youtube制作や声を無くした方々にとって特に有益です。

声を無くした方は、合成音声を通じて自分の感情や思いを表現することができ、
社会参加やコミュニケーションの場を広げることができます。

また、動画制作者は視聴者とのコミュニケーションを楽しむため、
合成音声は彼らの魅力を高める重要な要素となっています。

合成音声でできること

合成音声は、さまざまな用途に活用できます。

例えば、Youtuberは合成音声を使ってキャラクターの個性や特徴を表現し、魅力的なパフォーマンスを提供します。

さらに、声を無くした方は、声を失う前に録音し合成音声を生成することで、自分の声に限りなく近い声で合成音声を利用することができます。

また、他の人の声を借りて話す場合でも、合成音声を通じて自分自身を表現し、生活の質を向上させることができます。

例えば、日常会話や電話でのコミュニケーション、オンラインゲームでのチャット、
さらにはプロジェクトのプレゼンテーションなど、様々な場面で合成音声は役立ちます。

合成音声の仕組み

合成音声は、テキストから音声を生成する技術です。

このプロセスは、テキストデータを入力として、合成音声エンジンが音声波形を生成するというものです。

合成音声エンジンは、テキストの意味や文脈を理解し、自然な発声を行うことができます。

最近の合成音声技術では、機械学習やディープラーニングの手法が活用され、
より高品質かつ個別にカスタマイズ可能な音声が実現されています。

具体的な制作方法としては、筆者が知っている方法では以下の方法があります。

COEIROLINKで合成音声を作る方法

COEIROLINKは、合成音声を提供するための革新的なプラットフォームです。

【参考】
COEIROLINK

VOICEVOXの派生ソフトのようですが、現在は独自のエンジンを使用するなど、
様々な新機能を搭載し、使用料等も無料で(コエフォントは基本有料)合成音声を制作できます。

コーパスという決められた台本のようなものに合わせて音声を録音して、
公式サイトからGoogle colabをGoogleDriveと連携させて稼働させるだけで、簡単なものだと4時間ぐらいで出来上がります。

基本的な使い方と使い道は、COEIROLINKで読み込ませて動画や配信に使うことができます。

アップルの2つの新機能「Live Speech(ライブスピーチ)」と「Personal Voice(パーソナルボイス)」

アップルは、次期「iOS 17」において、アクセシビリティの向上を図るために、2つの新機能「Live Speech(ライブスピーチ)」と「Personal Voice(パーソナルボイス)」をリリースする予定です。

これらの新機能は、身体機能に関わらず、より多くの人々がiOSデバイスを使いやすくするための取り組みの一環です。

Live Speech(ライブスピーチ)

Live Speechは、アップルが導入する最新のアクセシビリティ機能の一つです。

この機能は、リアルタイムでの音声変換を可能にし、ユーザーが会話やコミュニケーションをより円滑に行えるようサポートします。

具体的には、ユーザーが話す内容をテキストに変換し、相手にリアルタイムで表示することができます。

これにより、聴覚障害を抱える人やコミュニケーションに困難を抱える人々が、円滑な対話を実現できるでしょう。

Personal Voice(パーソナルボイス)

Personal Voiceは、iOS 17で追加されるもう一つのアクセシビリティ機能です。

この機能は、ユーザーが個別にカスタマイズ可能な音声設定を提供します。

通常、テキスト読み上げ機能はコンピュータ生成の標準的な音声を使用しますが、Personal Voiceでは、ユーザーが自分自身の声や好みに合わせたカスタム音声を作成し、それを利用することができます。

これにより、ユーザーはより個人的で自然な音声でテキストを聞くことができ、より身近な体験を享受することができるでしょう。

以上2つの機能を発表することから、アップルは障害を持つユーザーや特別なニーズを持つユーザーが利用者が自分自身を表現し、より独自の方法でデバイスを活用できるよう努力していることがわかります。

通常VOICEVOXなどのツールを使う場合、既成のボイスしか使えなかったり、COEIROLINKで独自に生成するのも、
Pythonを使ったGoogle Colabを何十時間も稼働させて学習させなくてはいけない為、
カスタム音声をiOSで気軽に使えるというのはとても便利ですよね。

まとめ

合成音声技術は、動画制作者や声を無くした方々にとって、革新的なツールとなっています。

その自然な表現力と使いやすさにより、個性的で魅力的なパフォーマンスを提供したり、
自己表現を可能にしています。今後、合成音声さらなる進化が期待されます。

以上、お読みいただきありがとうございました。

あわせて読みたい記事

自己紹介と最近の様々な働き方について
AIの可能性について
さよならシャンシャン
別人になれる?RVCについて
夏の思い出

※このブログは、神奈川県横浜市にある就労継続支援A型事業所ほまれの家横浜」の70が執筆しました。