Нов модел с изкуствен интелект на Nvidia може да генерира аудио и да смесва различни видове звуци, дори да създаде звук, който никога преди това не е чувал. Технологичният гигант нарича AI модела Fugatto, което е съкращение от Foundational Generative Audio Transformer Opus 1.
Въпреки че има аудио-фокусирани AI платформи като Beatoven и Suno, Nvidia подчертава, че
Fugatto предлага на потребителите детайлен контрол върху желания резултат. AI моделът може да генерира или трансформира всяка смес от музика, гласове и звук въз основа на определени сигнали.
Говорейки за възможностите на
AI модела, Nvidia подчертава, че той е способен да генерира типове аудио изходи, за които не е бил обучаван преди това. „Fugatto може да накара тромпет да лае и саксофон да мяука. Всичко, което потребителите могат да опишат, моделът може да създаде”, твърдят разработчиците.
Освен това
Fugatto може да комбинира определени аудио възможности с помощта на технологията
ComposableART. Потребителите могат да поискат от AI модела да генерира аудиозапис на човек, който говори френски, докато се чувства тъжен. Потребителите могат също да контролират степента на тъга и тежестта на акцента с конкретни инструкции.