ディープラーニングで人間と同じ発音を学ぶ『WaveNet』Deepmindが開発

 

Googleの人工知能開発部門である「Deepmind」は、人間と同じような声をディープラーニングで獲得。状況や感情に応じてトーンや「間」などを使い分けて、人間が自然と会話しているかのような音声を出力する技術「WaveNet」を開発しました。現在までに英語と中国語でかなりの完成度になっています。

これまでの人工発声機能は機械的な音になりやすく違和感がありました。しかし「WaveNet」は自然な発声に極めて近く、公開されている音声を聞いても全く違和感がありません。既存のTTS技術は基本的に細切れにされた大量の音声データベースの単語をつなぎ合わせるだけであるのに対し、WaveNetでは、サンプリングした人間の音声からディープラーニング技術によって音声波形を細かく細分化して解析することで自然な音を獲得しています。
サンプル音源はリンク先で確認できます。

 

・WaveNet: A Generative Model for Raw Audio
https://deepmind.com/blog/wavenet-generative-model-raw-audio/

 

コメントを残す

メールアドレスが公開されることはありません。

CAPTCHA


その他

魔導物語 超きゅ〜きょく大全 ぷよぷよ入りに『魔導物語 はなまる大幼稚園児』が追加収録決定!絶賛予約受付中

D4エンタープライズは、1989年コンパイルがリリースした名作RPG『魔導物語』シリーズを収録『魔導物語 超きゅ~きょく大全 ぷよぷよ入り』の予約受付を開始しました。全40作画収録されたコレクターズアイテムとなっており、前回復刻した時に買えなかった方は是非この機会にお買い求めください。

この記事を見る
Androidアプリ iOSアプリ ゲーム全般 ニュース 海外

7年ぶりに怒れる鳥が動き出す。『アングリーバードアドベンチャー』が全世界で発売開始!

新作『アングリーバードアドベンチャー』を7年ぶりにリリースしました。世界中のApp Storeで配信中となります。

この記事を見る
NFT イベント ニュース

メタバース上で販売された初競りの電子マグロNFTが約80万円の値段で競り落とされる

なんでもありのNFTがついにマグロの初競りに挑戦です。2022年1月8日〜15日の間、NFT化された電子マグロの初競りオークションがNFTマーケットプレイス「nanakusa」行われました。この電子マグロNFTは最終的に3,000Maticで落札され、日本円にして約80万円の値段をつけました。

この記事を見る