Искусственный интеллект из фотографии делает видео

Интеллектуальная совокупность на базе метода глубокого обучения, созданная в Массачусетском технологическом университете (MIT), способна разбирать статические картины и додавать к ним анимацию, отображающую возможный сценарий предстоящего развития событий.

Не смотря на то, что генерируемые видеоролики длительностью не превышают секунды и имеют низкий уровень качества, они в большинстве случаев правильно интерпретируют обстановку. Так, фотографию поезда совокупность дополняет кадрами его постепенного перемещения по рельсам, волн — их набегания на берег,

Эта работа может стать родоначальницей нового типа разработок машинного зрения, наделяющих компьютеры свойством осознавать как объекты перемещаются в настоящем мире. Благодаря им роботы для дома, к примеру, будут пододвигать стул под планирующего усесться человека, а не убирать его.

Искусственный интеллект из фотографии делает видео

Чтобы научить собственную совокупность осознавать, что происходит на фотографии, исследователи тренировали две нейросети глубокого обучения на двух миллионах видеороликов Flickr неспециализированной длительностью 5 тыс. часов. Тренируемые сети соперничали между собой.

Одна из них генерировала синтетическое видео, а вторая пробовала отыскать в нем отличия от настоящих видеороликов.

В статье для издания New Scientist один из авторов, Карл Вондрик (Carl Vondrick), указал, что аннотировать видео дорого и сложно, но для задач машинного обучения в полной мере подходят широкодоступные материалы без какой-либо разметки.

Ранее Вондрик тренировал на материалах Youtube и сериалах модели глубокого обучения предугадывать взаимодействия и человеческие жесты, такие как рукопожатие, обнимание либо обмен поцелуями.

ИИ от NVIDIA обучился создавать фейковые видео


Похожие статьи, подобранные для Вас: