テクノロジーがより多様な発話パターンを認識できるようになることで、発話障害を持つ人々や発声に困難を抱える人々の日常生活を支援することができます。Google は、発話障害を持つ人々が音声認識をより利用しやすくすることを目指す研究 Project Euphonia を 2019 年から英語で開始しました。そして本日、Global Accessibility Awareness Day(GAAD)を祝い、この研究活動を日本語を含む 5か国語(フランス語、ヒンディー語、スペイン語、英語)に拡大します。
多くの場合、音声アシスタントは発話障害を持つユーザーの言葉を理解できません。これは、音声認識技術が、発話障害を持つ人々の音声サンプルを含む十分かつ多様な音声サンプルのセットでトレーニングされていないためです。ただし、過去 3 年間でそうした状況は徐々に変化しました。Google の研究開始以来、ボランティアから 1600 時間以上の音声サンプルを提供いただき、非常に広範な発話障害者音声データセットが作成できました。
これにより、Google の Speech および Research チームは、音声認識における最先端の機械学習研究を行っています。例えば、個々人の発声を理解するパーソナライズ モデルを作成する機能や、明瞭な合成音声が発話をあらためて言い直す音声認識機能の開発が含まれます。また、この研究は、Project Relate の開発にも役立っています。現在ベータ版として英語のみで提供しているこの Android アプリは、コミュニケーションをより身近なものにするために、パーソナライズ モデルにアクセスできるようにしています。
Google は、英語での研究成果に続き、日本語、フランス語、ヒンディー語、スペイン語をはじめとする他言語でも同様の進歩を遂げられることを期待しています。英語での研究を通じて、音声認識モデルをトレーニングする音声サンプルが多いほど、より多くの人々を理解できるようになることがわかっています。
スマートフォン、コンピューター、スマートホームの音声認識が思ったように反応しない、相手に言いたいことが伝わらないなどの経験をお持ちであれば、ぜひこの研究への参加をご検討ください。
日本語での参加を希望される場合は、こちらからお申し込みいただけます。
Posted by Project Euphonia Team