生成AIで音声を忠実再現 NTTが開発、話し方も

共同通信 2024年1月17日 19:30
 NTTが開発した音声合成技術のイメージ
 NTTが開発した音声合成技術のイメージ

 NTTは17日、生成人工知能(AI)を活用し、その人の声や話し方を忠実に再現する音声合成技術を開発したと発表した。インターネット上の仮想空間「メタバース」での活用のほか、病気などで失語した人の声を復活させるといった用途が見込まれる。商用化に向け、今後1~2年かけて実証研究を進める。

 新技術は、数分~10分程度の音声データを機械に読み込ませて声を合成する。性別や年代による声色の特徴を高いレベルで再現するだけでなく、同じ言葉でも「平静」や「喜び」、「悲しみ」など感情に変化をつけて発声できるという。数秒の音声データだけでも本人に似た声を再現できる簡易版の技術も開発した。

RECOMMEND

あなたにおすすめ
Recommend by Aritsugi Lab.

KUMANICHI レコメンドについて

「KUMANICHI レコメンド」は、熊本大学大学院の有次正義教授の研究室(以下、熊大有次研)が研究・開発中の記事推薦システムです。単語の類似性だけでなく、文脈の言葉の使われ方などから、より人間の思考に近いメカニズムのシステムを目指しています。

熊本日日新聞社はシステムの検証の場として熊日電子版を提供しています。本システムは研究中のため、関係のない記事が掲出されこともあります。あらかじめご了承ください。リンク先はすべて熊日電子版内のコンテンツです。

本システムは「匿名加工情報」を活用して開発されており、あなたの興味・関心を推測してコンテンツを提示しています。匿名加工情報は、氏名や住所などを削除し、ご本人が特定されないよう法令で定める基準に従い加工した情報です。詳しくは 「匿名加工情報の公表について」のページ をご覧ください。

閉じる
注目コンテンツ
全国のニュース 「科学・環境」記事一覧