旬のトピック、最新ニュースのマピオンニュース。地図の確認も。

Microsoft、たった3秒の音声サンプルから合成音声を作るAI発表

2023年01月12日09時51分 / 提供:マイナビニュース

Microsoftの研究者がこのほど、「VALL-E - Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers」において、人の声を忠実にシミュレートできる新たな音声合成人工知能(AI: Artificial Intelligence)をモデルを発表した。「VALL-E」と名付けられたこの音声合成AIモデルは、3秒間の音声サンプルを与えるだけで、学習してその人物の音声を合成することができ、話者の感情的なトーンを維持するように設計されている。

発表されたVALL-Eは「Neural Codec Language Model」とも呼ばれ、2022年10月にMetaが発表した人工知能技術を用いた音声コーデックである「EnCodec」の技術をベースに開発されている。波形を操作して音声を合成する他の音声合成技術とは異なり、テキストと音響プロンプトから個別の音声コーデックコードを生成する技術が採用されている。

関連記事

ネタ・コラムカテゴリのその他の記事

地図を探す

今すぐ地図を見る

地図サービス

コンテンツ

電話帳

マピオンニュース ページ上部へ戻る