Ключевые выводы
- DALL·E - это новая нейронная сеть, которая может рисовать изображения на основе текста.
- Сеть является одним из растущего числа проектов ИИ, которые могут имитировать творческую деятельность человека.
- Эксперты говорят, что изображения, нарисованные искусственным интеллектом, не являются оригинальными творениями.
Подвинься, Пикассо. Новая нейронная сеть может рисовать изображения на основе текста.
DALL·E, сочетание имен художника Сальвадора Дали и ВАЛЛ·И от Pixar, может взять любой текст и создать из него изображение. В системе используется нейронная сеть, обученная на миллиардах изображений и текстовых примеров. Это один из растущего числа проектов искусственного интеллекта, которые могут имитировать, но не воспроизводить творческий потенциал человека.
«Поскольку естественный язык постоянно развивается и очень зависит от контекстуальных нюансов, научить машину понимать язык достаточно хорошо, чтобы рисовать картинки, - очень важное достижение», - Тамара Шварц, профессор кибербезопасности Йоркского колледжа в Пенсильвании., - говорится в интервью по электронной почте. «Представьте себе полицейского рисовальщика, это редкий талант, способный создать картинку на основе описания свидетеля».
Использование больших данных для создания изображений
DALL-E был создан компанией OpenAI, занимающейся исследованиями искусственного интеллекта, и работает путем накопления огромных объемов данных из Интернета. Затем данные обрабатываются моделью естественного языка и обучаются создавать изображения из текста. DALL-E работает аналогично недавно выпущенной GPT-3, языковой модели, созданной OpenAI, которая может запрашивать создание исходных текстовых отрывков. GPT-3 был обучен с использованием полутриллиона слов интернет-текста и может создавать удивительно реалистичный текст.
Научить машину понимать язык достаточно хорошо, чтобы рисовать картинки, - очень важное достижение.
Майкл Юрушкин, основатель и технический директор BroutonLab, компании, занимающейся наукой о данных, сказал в интервью по электронной почте, что DALL-E - «один из немногих успешных ударов человечества по подражанию нашему творчеству и воображению». Он добавил: «Легче понять, как ИИ предсказывает что-то, просматривая соответствующие данные, но понять, как он может генерировать рисунки из вещей, о которых он никогда не «слышал» раньше, сложнее».
Шварц осторожно отмечает, что ИИ не создает информацию, а скорее берет языковые данные и преобразует их в изображения.
«Первоначальный творческий потенциал исходит от человека, который создал задачу», - сказал Шварц. «Со стороны ИИ есть некоторый «творческий подход», потому что он экспериментирует с различными комбинациями данных, а затем выбирает из ряда потенциальных результатов. Однако человек изучает результаты и учит ИИ выбирать из множества комбинаций».
Робот-детектив?
Машина может экспериментировать с этой комбинацией данных и объектов гораздо быстрее, чем человек-художник. Шварц отметил, что однажды DALL-E может сотрудничать с детективом, пытающимся реконструировать место преступления с помощью наброска, основанного на показаниях очевидцев.
«Поскольку свидетели дают свои показания, компьютер может взять эту разговорную информацию на естественном языке и создать рисунок сцены или несколько рисунков сцены», - сказала она. «Затем эти визуализации можно интегрировать для создания более точного изображения утерянных улик. Эту визуализацию можно обогатить, интегрировав предыдущие изображения места, предшествующего преступлению».
Несколько других программ, управляемых искусственным интеллектом, могут создавать произведения искусства. Например, Ai-Da использует систему роботизированной руки и технологию распознавания лиц в сочетании с искусственным интеллектом для создания произведений искусства. Система может анализировать изображение, помещенное перед машиной, которое используется в алгоритме для воспроизведения движений руки робота.
Тем не менее, люди-художники не должны беспокоиться о том, что роботы-повелители заменят их, утверждал Ахмед Эльгаммаль, директор Лаборатории искусства и искусственного интеллекта в Университете Рутгерса, в The New York Times в прошлом году.
«Хотя определение искусства постоянно меняется, по своей сути это форма общения между людьми», - написал он. «Без человека-художника, стоящего за машиной, ИИ может лишь играть с формой, будь то манипулирование пикселями на экране или нотами в музыкальной книге. Эти действия могут быть привлекательными и интригующими с точки зрения восприятия, но они лишены смысла без взаимодействия между художник и публика."
Посмотрев на работу DALL-E, я понял точку зрения Эльгаммала о том, что изображения, созданные искусственным интеллектом, не являются искусством. С другой стороны, они лучше любого искусства, которое я мог бы создать. Так, правда, какая разница?