Google разработи софтуерна технология, способна да имитира с висока точност човешки глас. Tacotron 2 ще се използва в приложения за преобразуване на текст в говор.
Системата се състои от две невронни мрежи за дълбоко обучение. Първата от тях преобразува текст в спектограма и я предава на към втора мрежа с алгоритъм
WaveNet, който озвучава спектограмата, генерирайки съответните звукови елементи.
Tacotron 2 може да се справи с трудни за произнасяне думи и наименования. Освен това системата е способна да променя интонацията в зависимост от препинателните знаци.
В момента
Tacotron 2 може да озвучава текстове само на английски език и само с женски глас. Очаква се технологията да бъде внедрена в услуги на Google като виртуалния помощник
Google Assistant и онлайн преводача
Google Translate.