Искусственный интеллект пишет картины в уникальном стиле

Искусственный интеллект пишет картины в уникальном стиле

Новое слово в живописи: искусственный интеллект «пишет» картины в уникальном стиле

Время от времени в мире появляются такие яркие художники (например, Клод Моне или Пабло Пикассо), которые буквально переворачивают мир искусства с ног на голову. Они изобретают собственные стили в живописи, в результате чего формируются новые направления в искусстве, скажем, импрессионизм или абстрактный экспрессионизм. Теперь же исследователи задались вопросом: может ли такой же прорыв в искусстве сделать машина?

И такие мысли вполне оправданы. Ещё недавно сообщалось о том, что нейросети научились рисовать простейшие рисунки. И вот теперь искусственный интеллект (ИИ) уже способен создавать изображения в нетрадиционных художественных стилях. Более того, большинство его работ уже получили общественное одобрение.

Команда разработчиков, в которую вошли исследователи из Ратгерского университета лаборатории Facebook’s AI, изменила тип алгоритма, известный как генеративные состязательные сети (GAN). В нём две нейронные сети «стравливаются» друг против друга с целью получения лучшего результата и собственного совершенствования. Так, одна сеть предлагает решение, а другая его критикует. Таким образом, алгоритм гоняет по кругу все решения пока не будет достигнут желаемый результат.

В «художественного одарённом» ИИ роль одной из этих сетей играет особый генератор сети, который создаёт изображение, а другую – распознаватель сети. Специалисты тренировали этого распознавателя сети на более чем 80 тысячах картин, чтобы он в конечном итоге научился понимать разницу между произведениями искусства и обыкновенной диаграммой или фото. Также он способен понимать разницу между различными стилями в искусстве — рококо или кубизм, например.

Интересен вызывает тот факт, что генератор создаёт работу, которую распознаватель признаёт в качестве произведения искусства, не попадающее ни под один из существующих стилей.

После того, как ИИ «написал» ряд картин, учёные попросили представителей общественности оценить их наряду с теми картинами, которые написал человек. Все опрошенные не знали, какие картины создала машина. Всех участников опроса спрашивали насколько сложной и новой они находили каждую работу. Кроме того, исследователей интересовало, вдохновляла ли их картина и поднимала ли настроение.

К удивлению авторов исследования, во многих случаях изображения авторства ИИ получали более высокие оценки, чем человеческие.

Примечательно, что в мире уже есть программы, которые способы слегка подправить фото так, чтобы оно имитировало стиль известных художников – того же Моне. Есть даже приложения (например, DeepArt), который с лёгкостью справятся с этой задачей. Но новая система предназначена для создания оригинальных работ, что называется, с нуля.

Результаты опроса весьма интересны, считает Кевин Уокер (Kevin Walker) из Королевского колледжа искусств в Лондоне. «Изображения, оцененные крайне высоко, содержат эстетически сочетание цветов и узоров, а картины, получившие плохие оценки, более однородны», — добавляет он.

Более того, Уокер сказал, что креативная машина уже создаёт работы для галерей. Например, двое его учеников в настоящий момент экспериментируют с ИИ, который способен перенимать их стиль рисования, чтобы создавать собственные работы. Одна из учениц использовала эту технологию, чтобы создать кадры для 12-минутного анимационного фильма.

Искусственный интеллект в роли творца. Как нейросети пишут картины и создают виртуальных людей

Главным отличием человеческого интеллекта от машинного долгое время считался творческий потенциал. Казалось бесспорным, что люди могут создавать произведения искусства и обладают уникальным стилем, в то время как бездушный компьютер лишь следует заданному алгоритму и потому предсказуем. Все изменилось с появлением искусственных нейронных сетей. Их алгоритмы настолько гибкие, что даже разработчики каждый раз удивляются результату. Сегодня системы искусственного интеллекта пишут вдохновляющие картины, анимируют фотографии, выполняют 2D/3D-конверсию и даже создают реалистичные портреты вымышленных людей, что находит неожиданное применение.

С чистого листа

В июне этого года художественная галерея Оксфордского университета стала местом смелого эксперимента на стыке искусства и технологий. Эйдан Меллер представил публике картины робота AI-Da, разработанного в Корнуолле. Гуманоидный робот-художница держит в манипуляторе карандаш или кисть. За 3-4 часа она может написать портрет с натуры или картину в жанре концептуальной живописи буквально с чистого листа.

Интересно, что посетители сочли ее картины даже более глубокими по содержанию, чем у признанных мастеров абстрактной живописи, чьи работы демонстрировались рядом. Меллер считает, что у AI-Da уже сформировался свой стиль, который он называет «Осколки света».

Сложнее всего было научить робота создавать картины с нуля, пусть даже абстрактные. Используя традиционные алгоритмические подходы, вы получите либо наборы фракталов, либо псевдослучайные сочетания графических примитивов, которые будут заложены в память заранее. Также гораздо проще добиться от робота фотореалистичности, чем уникального стиля и элементов непредсказуемости.

Появлению креативных роботов предшествовали системы искусственного интеллекта, способные подражать стилю известных художников. Исследователи из университета Эберхарда и Карла в Тюбингене (Германия) в своей научной работе детально описывают, как на основе любой фотографии ИИ создает картины, похожие на полотна Ван Гога, Пикассо, Тернера, Мунка и Кандинского.

Сначала исходная фотография анализируется сверточной нейронной сетью VGG-19 с использованием аннотированной базы изображений ImageNet. Слой за слоем из нее выделяются атрибуты стиля: характер линий, взаимное расположение объектов, цветовая палитра, длина штрихов и другие особенности. Затем они объединяются с исходным изображением, перенося в него все атрибуты стиля. Операция подобна применению фильтра в Photoshop, но работает на более глубоком уровне.

Полученные картины демонстрировались в 2016 году на выставке DeepDream в Сан-Франциско. Многие посетители приняли компьютерную графику за репродукции малоизвестных работ выдающихся художников.

Имитация почерка

С понятием индивидуального стиля также связаны особенности написания текстов от руки. Некоторые документы до сих пор требуется составлять собственноручно, поскольку в случае спора почерк однозначно идентифицирует автора и даже позволит судить о его психическом состоянии в момент подписания. А может ли робот подделать почерк, раз уж он копирует известных мастеров живописи?

Читать еще:  Искусство за решёткой

Не просто может, а делает это удивительно точно. К примеру, британская компания The Handwriting использует робота Hemingway для написания поздравительных открыток «от руки». По сути это небольшой станок с ЧПУ, чей искусственный интеллект был разработан в Брауновском университете (США) и не зависит от языка. Человек просто присылает образец почерка, ИИ анализирует его и воспроизводит в мельчайших деталях, будь то английские буквы или японские иероглифы.

Робот «Хемингуэй» пишет в семь раз быстрее человека и делает это очень правдоподобно. Пока графологическая экспертиза еще в состоянии отличить рукописные тексты от сымитированных роботом, но для неспециалиста результаты выглядят совершенно идентично.

Создание 3D-моделей

Во многих областях используются трехмерные сцены. Компьютерные игры, VR-чаты, прототипирование, демонстрация товаров на сайте и создание обучающих материалов — все это требует кропотливого труда 3D-дизайнеров.

Сегодня часть этой работы можно поручить искусственному интеллекту. Нейросети распознают объекты на фотографиях и достраивают 3D-сцену с минимальным участием человека. Например, сервис Theedy.ai предлагает использовать для этого несколько вариантов.

Исходное изображение загружается как фотография JPEG или чертежный CAD-файл. Кроме того, вы можете просто сканировать нужный объект, снимая его с разных ракурсов камерой смартфона. Готовые 3D-сцены можно посмотреть в браузере при помощи WebXR. Вам не потребуется устанавливать специфических приложений ни в Android, ни в iOS.

Пока сгенерированные ИИ трехмерные сцены уступают по качеству созданным вручную, однако иногда скорость важнее перфекционизма. Представьте авиасимулятор, в котором вы летите над мегаполисом. В нем тысячи зданий, включая совершенно уникальные. Если рендерить каждое вручную, разработка игры затянется, а пользователь все равно не успеет разглядеть детали с высоты птичьего полета. Проще загрузить в ИИ кадры аэрофотосъемки и получить 3D-модель города целиком.

Другой пример — онлайн-магазин с тысячами позиций. Либо на нем быстро появятся среднего качества 3D-изображения товаров, либо годами будет отображаться заглушка «Просмотр временно недоступен».

Анимация фотографий

Если долго разглядывать портрет, то можно представить, как изображенный на нем человек оживает и начинает двигаться. Наше воображение дополняет зрительную картину, создавая что-то вроде смешанной реальности. По такому же принципу работают генеративно-состязательные нейросети (GAN), способные анимировать «Мону Лизу» или вашу аватарку. Они по аналогии дорисовывают кадры с измененным ракурсом, а затем объединяют их в серию. Получается короткий ролик или GIF-файл.

Эта анимация была выполнена с помощью искусственной нейронной сети Nvidia StyleGAN. Компания открыла ее код, а заодно выложила в открытый доступ и базу Flickr-Faces-HQ. Она содержит более 70 тысяч качественных фотографий в формате PNG и применяется для быстрого обучения как StyleGAN, так и других нейросетей.

Желающим самостоятельно опробовать StyleGAN также понадобятся последние версии драйверов Nvidia, CUDA и библиотеки cuDNN. Минимальные аппаратные требования включают графический ускоритель с поддержкой CUDA 9.0 и выше, а также от 12 Гб оперативной памяти.

Создание виртуальных личностей

Обычно нейросеть обрабатывает какой-то кадр по указанному примеру. Она генерирует новое изображение, сочетающее в себе свойства исходного кадра и стиля из образца. Что будет, если таким образом совместить два портрета разных людей? ИИ сгенерирует портрет несуществующего человека.

При помощи StyleGAN можно создавать убедительные портреты никогда не существовавших людей. Это идеальное подспорье для рекламной индустрии: больше не придется платить фотомоделям и судиться с ними из-за разногласий в контракте. Вы просто генерируете новое лицо любого пола, возраста и национальности.

Можно поступить проще и зайти на сайт ThisPersonDoesNotExist, чтобы получить готовый портрет несуществующего человека. Их также генерирует Nvidia StyleGAN, только в облаке и без кастомных настроек.

В одних случаях имитация будет грубой, а в других — очень реалистичной. Распознать подделку поможет очень внимательное изучение картинки с увеличением. Обычно у сгенерированных изображений присутствуют артефакты в фоне или наблюдается эффект мозаичности. Например, у человека будут видны брекеты только на некоторых зубах или около уха вдруг окажется фрагмент дужки очков, хотя на снимке он без них.

Рассмотрим для примера сгенерированный портрет, использовавшийся злоумышленниками для создания фейкового аккаунта в LinkedIn. На первый взгляд, это профиль симпатичной девушки Кэти Джонс из Мичиганского университета… но что-то с ней не так!

Обратите внимание на глаза: они разного цвета. У людей встречается гетерохромия, но крайне редко: менее чем у 1% населения. А что у нее с ухом? Оно рассыпается на пиксели, словно его увеличили, забыв устранить артефакты JPEG. К тому же, сережка почему-то выглядит размыто, хотя она в зоне резкости. На левой щеке присутствуют следы ретуши, как будто случайно нажали Smudge tool в фотошопе. Вокруг отдельных прядей виден эффект свечения и повышения резкости, в то время как соседние сильно сглажены.

На самом деле все эти мелочи довольно трудно рассмотреть. Артефакты становятся видны при увеличении в 2 раза и более, причем анализировать нужно исходную фотографию, а не мелкую аватарку с превью. Поэтому на милое личико Кэти Джонс клюнули 52 человека, прежде чем LinkedIn заблокировал фейковый аккаунт. С начала года они появляются тысячами, и их все сложнее обнаружить.

С развитием нейросетей нового типа искусственный интеллект научился выполнять творческие задачи, которые до недавнего времени считались прерогативой людей. Результаты впечатляют и немного пугают открывающимися перспективами. Похоже, для отличия поддельных изображений и сымитированных текстов придется разрабатывать отдельные системы ИИ. Люди уже редко способны заметить подделку без тщательного анализа.

Вряд ли стоит опасаться того, что нейросети оставят без работы художников и дизайнеров. Скорее, они станут удобным подспорьем для быстрого выполнения рутинных задач, а сами профессии эволюционируют под влиянием новых инструментов.

Читать еще:  Египетский художник. Maher Morcos

Искусственный интеллект пишет картины в уникальном стиле

Если вы читаете книги вроде «Роботы наступают» Мартина Форда и следите за тенденциями в мире технологий, то новость о том, что искусственный интеллект изменит расстановку сил на рынке труда, вас не удивит. Машины уверенно вытесняют с рабочих мест людей, чья профессиональная деятельность сводится к выполнению рутинных задач.

А как обстоят дела на творческом фронте? Согласно одному исследованию, зрители уже оценили картины, созданные искусственным интеллектом, выше, чем нарисованные людьми. Неужели нейросети представляют угрозу и для художников? Претендует ли искусственный интеллект на доминирующую роль в искусстве? Или способность творить все же останется во власти человека?

Создание изобразительного контента уже давно не прерогатива людей. «Какая занятная репродукция Джоконды. — Да что вы, Людмила Прокофьевна! Это же нашу вычислительную машину Боровских запрограммировал. Уже месяц висит», — говорила секретарша Верочка в фильме «Служебный роман», снятом в далеком 1977 году.

Современное AI-творчество шагнуло намного дальше. Его выдающиеся образцы можно увидеть на площадке Ai Artists, созданной куратором Марни Бэнни. Например, перформансы художницы Сугвен Чунг, которая сначала обучает ИИ на собственных рисунках, а потом устраивает арт-представления вместе с машинной версией себя. Работы Дэвида Янга, который на своих фотографиях учит компьютер изображать цветы. Серию картинок «Нейрозоопарк» Софии Креспо, изображающих несуществующие организмы. Примеров — десятки.

Сегодня digital-художники на пару с нейросетями создают вещи, способные потягаться со «старыми мастерами» за деньги коллекционеров. Так, в октябре 2018 года искусственный интеллект официально вступил на территорию арт-мира: впервые в истории аукционный дом продал картину, принадлежащую кисти нейросети. С молотка ушел «Портрет Эдмонд Беллами» — произведение арт-группы Obvious, работающей под лозунгом «Творчество не только для людей». Изначально картина оценивалась в $7-10 тысяч, а в итоге была продана за $432 тысячи. И хотя это далеко не те суммы, за которые выкупают Малевича или Пикассо, она уже догоняет стоимость самоуничтожившейся «Девочки с воздушным шаром» Бэнкси, проданной за $1,4 млн.

Уже через полгода после «Эдмонда Беллами» на аукцион вышло второе творение искусственного разума. Им стала инсталляция «Воспоминания прохожих», оцененная в £30-40 тысяч. В ней нейросеть в режиме реального времени генерирует бесконечный поток уникальных портретов. Автор работы — художник Марио Клингеманн, один из пионеров использования искусственного интеллекта, машинного обучения и нейросетей в искусстве. По его словам, человеку сложно придумать что-то новое, а нейросеть помогает создавать действительно интересные вещи.

Получив данные, нейросеть начинает диалог генератора и дискриминатора. Цель первого — создать изображение, способное обмануть дискриминатор. Цель второго — сравнить предложенное генератором с базой данных, вернуть «подделку» и дать обратную связь о ее качестве. Получив фидбек, генератор создает изображение на основе новых правил. Процесс продолжается до тех пор, пока дискриминатор не признает, что созданная генератором картинка — уникальна. В случае с «Портретом Эдмонд Беллами» в базу загрузили 15 000 изображений, а проданный лот можно считать 15 001-ой вариацией.

Художники активно используют генеративно-состязательные сети в творческих целях. Результатом являются работы, которые иногда объединяют термином «ганизм» (GANism). Иногда такие работы вызывают восхищение, иногда — эффект «зловещей долины» (когда объект, который выглядит и действует почти как человек, но с некоторыми отклонениями от нормы, вызывает неприязнь и отвращение у людей-наблюдателей. — Прим.) Как например изображения в стиле ню, полученные Робби Барратом и его алгоритмом, изучившим 10 000 изображений обнаженных тел. «Люди на них получились в виде сюрреалистичных сгустков плоти с произвольно растущими усиками и конечностями. Интересно, неужели машины видят нас такими. ».

Завораживающие картины, созданные искусственным интеллектом (10 фото)

Гора МакКовен

Команда исследователей попробовала «научить» сеть, показывая ей примеры изображений, которые она должна была запомнить. Например, чтобы научить ИИ, что означает слово «горы», они показывали ей различные фото гор.

Красное дерево

В новом докладе под названием «Инсептионизм: углубление в нейронные сети» исследовательская группа Google подробнейшим образом анализирует работу искусственных нейронных сетей, особенно в качестве программного обеспечения, предназначенного для распознавания изображений.

Повторяющиеся места

Тем не менее, они получили довольно странные результаты, когда попросили сеть создать собственное изображение на основе того, что она «выучила». В одном случае, когда ей велели нарисовать гантели, сеть создала картинку, где объединила металл и человеческие руки, вероятно, из-за того, что каждый образ с гантелями, который был ей показан, включал в себя руки, держащие гантели.

Генерирование изображений

В некоторых иных тестах команда исследователей попросила нейронные сети найти на изображениях конкретные вещи, которых на самом деле там не было. Идея заключалась в том, чтобы заставить искусственный интеллект модифицировать начальное изображение для получения желаемого объекта.

Нейронная статическая память

Во ходе других испытаний сотрудники Google сказали сети ИИ производить случайные изображения без подсказок, основываясь лишь на случайных нейронных воспоминаниях, присутствующих в статической памяти.

Странный Сиэтл

Исследователи Google говорят о таких случайно генерируемых изображениях, как о «снах» искусственной нейронной сети.

Оказывается, ИИ может спать и видеть удивительных овец вместе с деформированными птицами и множеством глаз …

… И может также видеть много других сумасшедших визуальных изображений. Наверно так выглядит «Властелина Колец», если смотреть его под кайфом.

Если считать картины искусственного интеллекта отчасти примером модернистского искусства, то вероятно, весьма приемлемо, что ИИ использовал несколько приемов Эдварда Мунка, с помощью которых тот создавал «Крик». Но при чем здесь настойчивое использование глаз? И неужели это … собака с левой стороны картины?

Читать еще:  Женская вселенная. Cannibal Malabar

Красивые и сложные

Другие изображения оказались необыкновенно красивыми и сложными одновременно. Команда Google планирует продолжить свое наблюдение за тем, какие образы формируются на глубоких нейронных уровнях, поскольку она решила продолжить обучение искусственного интеллекта, чтобы тот смог лучше распознавать необходимые изображения.

Искусственное искусство: как нейросети научились творить

Едва мир искусства оправился от порезанной прямо во время торгов Sotheby’s картины Бэнкси, как в четверг, 25 октября, на нью-йоркском аукционе Christie’s произошло еще одно знаменательное событие: там впервые была продана работа, созданная искусственным интеллектом. При первоначальной оценке в $7000-$10 000, ее продажная цена составила $432 000. Порядок цен соответствует мастерам «первой величины»: на том же аукционе серия принтов Энди Уорхола была продана за $780 000.

Работа была создана трио 25-летних французских студентов Obvious, которые, по их собственным словам, занимаются «демократизацией» искусственного интеллекта через искусство. За последний год они сделали серию портретов, изображающих членов вымышленной семьи Белами. Можно было бы сказать, что портрет Эдмонда Белами стал вершиной их творчества, однако творили не они, а программный код, — к тому же созданный не ими.

Автор кода — 19-летний Робби Баррат, студент Стэнфордского университета. Когда Баррату было 17 лет, он начал экспериментировать с искусственным интеллектом. Сначала он обучил компьютер писать рэп, загрузив в него 6000 строк из композиций Канье Уэста, а потом пошел дальше и загрузил в программу несколько тысяч изображений из Интернета, чтобы научить ее рисовать. Свой код он загрузил на GitHub. Так нейросеть, которой и воспользовались Obvious, оказалась в открытом доступе.

«Я действительно ожидал, что люди будут использовать код в качестве компонентов для своего собственного проекта. Но я никогда не думал, что кто-нибудь продаст его, потому что это некачественная работа», — сказал Баррат The Washington Post.

Нейронная сеть чаще всего применяется для распознавания образов: на вход подается некоторая неструктурированная информация, например, изображения, звук или текст, а на выходе мы хотим получить некоторый семантический вывод. Например, для изображения это может быть информация о находящихся на нем объектах. Однако нейронная сеть может также использоваться и для генерации новых данных, — такие сети называются генеративными. «Подобные сети на вход могут получать некоторый набор случайных значений, а задача сети — сгенерировать выход, который будет похож на реальное изображение, например, лицо человека», — объясняет ведущий исследователь VisionLabs Сергей Миляев. Obvious, к примеру, показали нейросети 15 000 портретов, написанных между XIV и XX веками — этим и объясняется своеобразный стиль картины, созданной компьютером.

Основная идея GAN заключается в том, чтобы тренировать сеть на поиск шаблонов в определенном наборе данных. Обнаружив общие черты, которые присущи всем предложенным объектам, программа-генератор на их основе создает свой вариант компиляции. Затем вторая сеть — дискриминатор — оценивает ее работу, и если она может определить разницу между оригиналами и новым образцом, то отправляет изделие на доработку. Первая сеть (генератор) модифицирует свои данные и пытается снова провести их через дискриминатор, повторяя это до тех пор, пока вторая сеть не перестанет отличать подделку от оригинала. «При этом на вход такой сети может подаваться как реальное фото (как, например, в приложении Prisma, которое создает картины на основе загруженных фотографий), так и другие данные, например, набросок карандашом, или даже портрет другого художника, у которого мы хотим изменить стиль», — объясняет Миляев.

Эта концепция сетей оказалась чрезвычайно мощным инструментом машинного обучения. Благодаря ему сети знают, как копировать основные визуальные шаблоны, но они не имеют ни малейшего представления, как они сочетаются друг с другом. На выходе мы получаем изображения, в которых границы нечеткие и фигуры перетекают друг в друга. Инженеры Google даже предложили для этой эстетики специальное название, по аналогии с историей искусства — GANism.

Наиболее известная из подобных сетей — генеративная состязательная сеть (GAN), тип алгоритма, впервые разработанный Яном Гудфеллоу, исследователем, который сейчас работает в Google. В честь него Obvious и назвали свою серию работ портретами семейства Белами — это переведенный с французского каламбур «бел-ами», что означает «хороший друг», то же самое, что и «гуд-феллоу» — с английского.

Как исследователей ИИ, так и художников эта история вводит в заблуждение: кажется, что сети GAN более сложны и автономны, чем они есть на самом деле. В частности, художников беспокоит вопрос об авторских прав на подобное искусство: если Obvious ничего не придумывали сами, а использовали готовый код Робби Баррата, то кто является создателем картины? И вообще, можно ли считать это искусством? Надо сказать, в своих вопросах они не оригинальны. 100 лет назад Вальтер Беньямин точно так же отвечал на вопрос об искусстве фотографии. Он даже написал эссе «Искусство в эпоху его технической воспроизводимости», где определил, что и фотография, и другие «объекты», произведенные машиной без участия человеческого таланта, вполне могут стать произведением искусства, как, например, фотография или кино в начале XX века. А Марсель Дюшан тогда же стал делать редимэйды и выставил в музее свой знаменитый «Фонтан» (то есть писсуар). Картина, созданная ИИ, ничем не хуже.

Поэтому во всей истории с портретом Белами важно даже не кто и как сделал эту работу, а то, что покупатель был готов заплатить за нее почти $0,5 млн. Это и стало причиной всех дискуссий: принт, созданный нейронной сетью и проданный за $7000, вряд ли послужил бы предметом жарких споров.

Ссылка на основную публикацию
Adblock
detector