Принимаю условия соглашения и даю своё согласие на обработку персональных данных и cookies.

Чему научились нейросети в 2019 году. Пять пугающих навыков искусственного интеллекта

5 января 2020, 15:00
За последние 12 месяцев возможности нейросетей выросли. Что только они не умеют теперь: рисовать картины, имитировать голос и манеру речи человека и заменять одного актера в фильме на другого. Собрали самые значительные достижения в области нейронных сетей за ушедший год.

Живые фото

Специалисты Samsung AI Center-Moscow и «Сколково» создали систему, которая по нескольким изображениям человека создает анимацию. Изображений — фото или рисованных портретов — нужно от одного до восьми. Так, можно увидеть в движении, например, Федора Достоевского.

DeepFake

Технология «глубокой подделки» вызвала резонанс. Ведь при помощи этого алгоритма можно создать видео с любым человеком: заменить одного актера в фильме на другого, подделать речь политика и многое другое. С каждым месяцем технологии DeepFake становятся все лучше. Посмотрите эту сцену из «Терминатор 2: судный день». Там нет Арнольда Шварценеггера — вместо него Сильвестр Сталлоне.

Музыка

Нейросети научились писать музыку в разных стилях. В начале прошлого года «Яндекс» показал нейросеть, которая написала пьесу для симфонического оркестра с альтом. Еще есть, например, нейросеть от компании Dadabots, которая в прямом эфире на YouTube-канале сочиняет death-metal. Осторожно, там звуки преисподней.

Картины

Существуют нейросети, которые создали, чтобы распознавать объекты на изображении. Эти нейросети состоят из 10–30 слоев, которые связаны между собой. Работает это так: сеть получает картинку, анализирует ее и передают результаты анализа следующему слою. Например, один слой может опознавать на изображении края и углы, другой — собирать детали объекты типа деревьев. Последние слои объединяют все результаты и определяют, что изображено на картинке.

Даже если нейросети показать простой белый шум, они найдут в нем нечто удивительное и создадут свою картину.

Клоны голосов

В конце прошло года Тимур Бекмамбетов рассказал, что его компания Screenlife Technologies и разработчик HR-сервиса «Робот Вера» «Стафори» запустят проект Vera Voice. Сервис работает на основе нейросети — она анализирует голос, воспроизводит его цифровую копию и самостоятельно обучается.

Копию голоса синтезируют с учетом специфического произношения слов, скорости речи, интонаций и тембра. Технологию будут использовать для озвучки фильмов, сериалов и рекламы. Компания пообещала отлавливать подделки и защищать известных людей от несанкционированного копирования их образов. Послушайте, как звучат клонированные голоса Владимира Путина, Владимира Познера и Ксении Собчак: