Пробив в машинното обучение проправя пътя за роботи, които се учат като хората – чрез проба и грешка. Учени от Google DeepMind и Университета в Торонто създадоха алгоритъма DreamerV3, който може да стане експерт в Minecraft само за 9 дни, като се учи самостоятелно да копае диаманти без подсказване.
Новата AI разработка е стъпка към създаване на универсален изкуствен интелект, който може да овладее задачи от всякакво ниво на сложност – от управление на роботи до анализиране на данни, използвайки един набор от правила.
DreamerV3 работи чрез „вътрешен симулатор”, или невронна мрежа, която предвижда последствията от действията така, както шахматист изчислява ходовете си. Създавайки виртуален сценарий, алгоритъмът оценява неговата стойност от втора мрежа („критик”) и избира оптималното решение от трета („актьор”).
Например, за да намери диамант в
Minecraft, системата последователно се учи да изсича дърво, да създава кирка и да изследва пещери, без външни инструкции, само чрез събуждане на интерес към целта.
Основното предимство на DreamerV3 е стабилността. За разлика от класическите алгоритми като PPO, които изискват фина настройка за всяка задача, новият AI запазва едни и същи параметри за всички 150 тестови сценария, от аркадни игри до управление на роботи.