Нейросети для совместного творчества
04/10/2022
Художникам, помимо вкуса, стиля, авторской манеры и креативных идей, крайне важно мастерство. Мастерство это нарабатывается годами и подвластно не всем. Но только не в век новых технологий. С помощью нейросетей каждый может попробовать себя в роли художника или, скорее, в роли заказчика художественного полотна.
Поток новостей о возможностях искусственного интеллекта (ИИ), и в частности нейросетей, не ослабевает. В майском номере журнала "Системы безопасности" мы уже рассказывали о возможностях нейронной сети DALL-E 2 от компании Open AI.
Потребовалось совсем немного времени, и на рынке появилось уже несколько подобных продуктов. Приятно заметить, что в этом числе и наши разработчики: Сбер AI опубликовал сеть ruDALLE XXL (Kandinsky) на 12 млрд параметров. Модель немного уступает DALL-E 2 по качеству изображения, но уже значительно лучше предыдущей версии. Попробовать ее уже можно в приложении "Салют" от Сбера.
Достаточно просто произнести: "Запусти художника", а затем голосом попросить ruDALL-E что-нибудь нарисовать. В отличие от других сетей разработка Сбера понимает русский язык.
Не могла остаться в стороне от таких событий компания Google, выпустившая своего конкурента DALL-E 2 – Imagen. По оценкам самой компании, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности. Компания предложила группе тестировщиков сравнить иллюстрации, созданные при помощи Imagen, DALL-E 2 и других моделей преобразования. Эксперимент показал, что люди чаще всего отдавали предпочтение изображениям, сгенерированным нейросетью Google.
Но не только мировые техногиганты способны создавать такие продукты. Небольшой стартап MidJourney, в котором работает всего 10 человек, выпустил одноименный продукт, который не уступает именитым конкурентам по качеству, но даже выигрывает по сложности картинки. К примеру, после ряда опытов арт-директор монреальского офиса Ubisoft Эрик Белльфель с помощью этой нейросети создал звездолеты в стиле, который я бы охарактеризовал как барокко-панк – сумасшедшая смесь элементов дизайна времен да Винчи и современных высоких технологий. Собственно, получившиеся изображения звездолетов очень напоминают то, что нарисовал бы сам Леонардо.
Другой пример: эту нейронную сеть использовали для создания видеоролика песни Егора Летова "Все идет по плану" и получили ошеломительный видеоряд1.
Нельзя не отметить и сеть Stable Diffusion от стартапа stability.ai. В отличие от других она заточена на генерацию пейзажных фотографий, которые потрясают своим качеством и достоверностью2.
Появление подобных продуктов кардинально меняет отрасль дизайна, иллюстрирования и фотографии. Возможно, скоро исчезнет профессия фотомодели, а дизайнер уже сейчас превращается в промоинженера (это новая специальность, где человек может формулировать текстовые запросы к нейросетям так, чтобы получать наиболее точный и выразительный результат).
Здесь наиболее показателен пример одного из самых модных мировых журналов Cosmopolitan, использовавшего сеть DALL-E 2 для создания обложки. Нейросети понадобилось только 20 сек., чтобы по фразе "Широкоугольный снимок снизу женщины-космонавта с атлетической и женственной фигурой, развязно идущей вперед к объективу камеры, находясь на Марсе внутри бесконечной Вселенной. В стиле синтвейв, цифровой арт" создать финальную картинку. Конечно, чтобы прийти к этой фразе, понадобились сотни вариантов, сгенерированы тысячи снимков, прежде чем найти идеальный, но важен сам факт: нейросеть генерирует изображения такого качества, которое ранее могли сделать только дизайнеры с мировым именем.
1 https://www.yapfiles.ru/show/2773591/1aeb04687957e5e4cc23600bfe89a42e.mp4.html
2 https://petapixel.com/2022/08/16/these-are-not-photos-beautiful-landscapes-created-by-new-ai/