Обзор нейросетей для создания иллюстраций и артов

Специальный корреспондент
Собака

Собака

Пресс-служба
Команда форума
Private Club
Регистрация
13/10/15
Сообщения
55.197
Репутация
63.040
Реакции
277.539
RUB
0
Мир нейросетей развивается с невероятной скоростью. Ещё вчера генерация изображений по текстовому описанию казалась чем-то фантастическим, а сегодня уже существуют десятки сервисов, соревнующихся в качестве и реалистичности результатов. Но как выбрать инструмент, который подходит именно вам?

В этом обзоре мы не будем загружать вас техническими подробностями и сложными терминами. Мы пойдём другим путём — протестируем популярные нейросети на конкретном задании и посмотрим, кто справится лучше.


Пройдемся по моделям с одним запросом: картинкой для комикса по истории Деда Мазая и зайцев, а именно:

Три кролика в стиле Don't Starve, купаются в пруду, вид сбоку, толстые контуры, темные тени, мрачный и милый стиль, осенняя цветовая палитра, на заднем плане - силуэты деревьев и костры, глаза светятся в темноте, рядом с прудом - разбросанная морковь, ночь
Three rabbits in the style of Don't Starve, bathing in a pond, side view, thick outlines, dark shadows, grim and cute style, autumnal color palette, silhouetted trees and a campfire in the background, eyes glowing in the dark, scattered carrots near the pond, nighttime
Если что, то для сравнения схожести стиля, будем ориентироваться на это:

a7cf391234e7be1a198b267b40cd8e44.png

Что в целом свойственно стилистике игры Don't Starve? Мультипликационная мрачность с элементами готики, что-то напоминающее Тима Бертона; неровные, отчасти рваные контуры; имитирование традишки, например, текстура старой бумаги, рисунок карандашом/углем/тушью; использование приглушенных цветов с контрастными элементами.

Midjourney​

Midjourney уже не первый год держит планку королевы нейросетей. 15 миллионов пользователей — впечатляющая цифра, которая говорит сама за себя. И это не просто "мертвые души" — Midjourney живет и активно развивается: ежедневно более миллиона человек создают с её помощью новые изображения.

В чем же секрет такого успеха? Во-первых, Midjourney генерирует действительно классные картинки: четкие, детализированные, с проработанным стилем. Во-вторых, она дает пользователям кучу возможностей для творчества: можно настраивать буквально все — от соотношения сторон до дисперсии, стилей и фильтров.

41287a4a0a764fc547493985de51d390.png

Конечно, сразу разобраться во всех тонкостях Midjourney может быть непросто. Интерфейс у нее не самый дружелюбный, да и регистрация в Discord — дополнительный квест.

Единственный минус — Midjourney теперь не получишь просто так. Придется раскошелиться на подписку (от 8 долларов в месяц). Но для серьезного творчества — это не такая уж и большая цена, правда?

Я решила воспользоваться для генерации иллюстрации, ввиду банальной простоты использования Midjourney внутри сервиса, поскольку не всегда есть возможность совершить оплату подписки не с российской карты, да и в целом, когда ты нечастый пользователей того же Midjourney, зачем оплачивать подписку, если можно оплатить только одну генерацию, условно, конечно, но, думаю, суть передала.

Итак, передав наш промт нейросети, мне сгенерировало 4 варианта, оставила наиболее подходящий под запрос:

f1a044190003d227d88c759d7e1807fe.png

Не могу сказать, что это точное попадание в стилистику игры, однако, как мне кажется, если поиграть с промтом, можно получить результат совершенно другого уровня и гораздо больше походящий на правду. Но если смотреть в общем: картинка приятная по цветам, мы передали в запрос осенний вайб - и здесь он очень хорошо читается. Все, чего мне не хватает, так это именно имитации традиционных материалов, но, вероятно, это решается корректировкой промта.

Playground AI​

Следующий сервис приятный сюрприз для тех, кто ищет мощную и удобную нейросеть для создания изображений, но не готов тратить на это целое состояние. Эта платформа — настоящая находка, особенно для российских пользователей: работает без VPN, да и с щедростью у неё всё в порядке — 500 бесплатных изображений в день.

5ae19d614ba7ed357d3e4a489e6aed2d.png

В основе Playground AI лежит передовая модель Stable Diffusion. Если 500 изображений в день вам окажется мало, всегда можно перейти на премиум-тариф (от 12 долларов) и получить доступ к расширенному функционалу. Единственный момент — с оплатой из России могут быть небольшие сложности.

Итак, посмотрим на изображение по нашему промту:

097af99803a414c9caa9e4f966126f3b.png

По стилю рисовки чем-то напоминает эффект масляной краски в фотошопе. Если в общем - то один кролик куда-то пропал, хотя два других выглядят неплохо. Если по промту: кролики "уселись" на берегу, а не в воде; пропали костры и морковь; стилистика сама по себе немного далека от мрачности. Получившаяся картинка отличается от промта, она содержит общие элементы, однако в целом не соответствует нашему промту.

DALL-E​

Еще в 2021 OpenAI представила DALL-E. Это была одна из первых нейросетей, которые умеют качественно рисовать картинки по текстовому описанию. Dall⁠-⁠E 3 представили в конце сентября 2023 года, а публичный доступ к ней появился в начале октября.

Нейросеть доступна бесплатно через Bing Image Creator и по платной подписке в ChatGPT.

3e57879d07b945e051ce8a8145e3b86c.png

Bing AI Image Creator​

Bing AI Image Creator – отличная возможность познакомиться с миром нейросети DALL-E. Microsoft интегрировала эту передовую технологию в свой браузер Bing, предлагая пользователям простой и удобный редактор изображений на базе искусственного интеллекта. Главное достоинство – использование DALL-E 3, улучшенной и более совершенной версии платной нейросети.

fa6d98302f7c8cac55a504bf82f7ca56.png

Bing AI Image Creator выделяется на фоне конкурентов своей доступностью: это единственная полностью бесплатная нейросеть в нашем рейтинге. Достаточно просто войти в свою учётную запись Microsoft, и можно творить. Ежедневно доступно создание более 100 изображений, а ограничения по кредитам влияют только на скорость генерации, но не на количество. Важно отметить, что доступ к сервису возможен только через VPN.

Сначала я решила воспользоваться DALL-E через BotHub, для генерации изображения по промту:

cb52fe4f633569c03d134e5ba98307b8.png

Вообще, выглядит интересно, хотя и напрягают глаза на фоне, а также палатка на фоне, которая как бы внутри вольера с зайцами, но в то же время снаружи. Палитра также будто бы слишком на контрасте, с точки зрения композиции - много элементов, которые оттягивают внимание с трех зайцев на переднем плане.

Теперь сгенерируем через Bing:

23c26c158fe45f032c6428386e1be3e3.png

Уже что-то более спокойное и приятное. Появилось освещение и даже неплохо обыгранное. Но не хватает некоторой небрежности в рисунке, которая создавала бы более мрачную и зловещую атмосферу. В целом, картинка довольно точно соответствует промту, есть лишь несоответствия в стиле, который можно трактовать двояко.

Leonardo AI​

Leonardo AI — это не просто очередная бесплатная нейросеть для генерации картинок. Это настоящий инструмент для творчества с широчайшими возможностями. Помимо стандартной генерации по текстовому описанию или изображению-образцу, Leonardo AI позволяет обучать собственные модели и загружать их в редактор. Можно экспериментировать с настройками, подсказками, стилями — и результат сможет вас впечатлит. Кстати, после регистрации вас ждёт небольшой 5-шаговый гайд, который поможет освоиться на платформе.

a1ca7f67a561861a6962ac3165def538.png

Чем ещё интересен Leonardo AI? Например, режимом холста, где можно не только ретушировать и улучшать изображения, но и менять их стиль, а также "растягивать" картинки на больший размер. А ещё здесь можно генерировать текстуры для 3D-моделирования.

Каждый день платформа дарит пользователям 150 бесплатных кредитов — более чем достаточно, чтобы создавать интересные изображения. Правда, за некоторые "плюшки" придётся доплачивать (премиум-подписка от 10 долларов в месяц).

Из плюсов — Leonardo AI работает без VPN и предлагает огромное количество настроек, так что, при желании, можно добиться потрясающих результатов. Но это и минус: придётся потратить время на освоение всех тонкостей, да и большинство крутых фишек — платные.

Попробуем скормить свой запрос и оценить генерацию картинки:

8f5a7b8b36dce36e32eea6548cb3fa15.png

Иллюстрация выглядит симпатично, однако совсем не в стиле Don't Sterve. Иллюстрация не передает готичную стилистику игры, картинка более мягкая и комфортная, нежели мрачная, а также выполнена в довольно ярких цветах, что не совсем характерно нашему запросу. Хотя, если не брать это во внимание, то изображение получилось интересным.

Kandinsky​

Kandinsky – это русскоязычная нейросеть от Сбера, создающая изображения и другой контент по текстовым описаниям. В отличие от Midjourney, известной своими мультяшными картинками, Kandinsky делает ставку на фотореализм.

В основе Kandinsky лежит принцип диффузии: сначала изображение «зашумляется», превращаясь в нечто похожее на серый экран телевизора, а затем нейросеть шаг за шагом восстанавливает его, добиваясь реалистичности.

f4b59401dca1079b89b745ee1101dc2a.png

Kandinsky — это не просто генератор картинок по текстовым описаниям. Эта нейросеть от Сбера умеет гораздо больше. Kandinsky способна создавать новые картины, органично смешивая элементы двух разных изображений, а также менять стиль уже существующих изображений, например, в духе любимого художника. Нужен фон для картины? Kandinsky дорисует. Также нейросеть позволяет переносить позы, предметы и другие элементы с одной картинки на другую. А еще Kandinsky умеет создавать короткие гифки, из которых можно собирать небольшие видеоролики.

Подадим наш запрос:

571cd92399c4b97e2568f4bd696a0b83.png

Арт получился довольно приятным, однако стиль рисовки получился сказочной, уютный и добрый, что далеко от нашего запроса: нет гротескности и мрачности. Наша осенняя цветовая палитра вышла просто теплой, а также мы потеряли морковь возле пруда. Если суммировать, то картинка не соответствует описанию в полной мере из-за различий в стиле и передаваемой атмосфере.

Шедеврум​

«Шедеврум» — это не просто сервис для генерации картинок на базе нейросети YandexART, а полноценная социальная сеть для любителей цифрового искусства. Здесь можно подписываться на понравившихся авторов, оценивать работы, оставлять комментарии и находить вдохновение в ленте рекомендаций.

d1fa0177758176e27c661e77be1ce724.png

Отличительной особенностью «Шедеврума» является высокое качество генерируемых изображений. Нейросеть YandexART использует метод каскадной диффузии: сначала создается базовая картинка, а затем, шаг за шагом, увеличивается её разрешение и прорабатываются детали. Доступно в веб-версии, на iOS и Android.

Посмотрим на нейросеть в действии:

ad13f62b0049f012306cb7a287d104b3.png

Начнем со стиля: он больше мягкий и мультяшный, чем тот, что мы хотели. Если говорить об атмосфере, то она воспринимается больше сказочной, чем мрачной, а это, вероятно, из-за теплой палитры цветов. Стоит также сказать, что отсутвуют костры и морковь. Вообще, картинка содержит так называемую базу, вроде трех кроликов и пруда, но общий стиль и атмосфера разнятся с нашим запросом.

Starry AI​

Starry AI – отличный вариант для тех, кто делает первые шаги в мире нейросетей и хочет попробовать себя в генерации изображений. Здесь всё предельно просто и понятно: удобный интерфейс, простой редактор — разберётся даже новичок. А если возникнут сложности с формулировкой запроса, Starry AI всегда подскажет, как его улучшить, чтобы получить именно то, что нужно.

f82f898115d9c9cc06b21e0671f6f9e8.png

Конечно, по мощности Starry AI уступает некоторым монстрам индустрии, но у неё есть своё очарование — огромная коллекция стилей (больше 1000!). Можно экспериментировать и пробовать, искать свой собственный почерк. Единственное, стоит иметь в виду, что качество картинок может варьироваться, да и с анатомией у персонажей иногда бывают проколы.

Каждый день Starry AI дарит пользователям 5 бесплатных кредитов. Есть премиум-подписка, которая позволит творить без границ (от 12 долларов). И ещё один плюс — Starry AI доступна не только на компьютере, но и на смартфоне (iOS и Android).

Теперь посмотрим на нейросеть в действии:

c3282383719adafcc2e4d77993cf95a9.png

Сразу, с порога некоторые вопросы к анатомии и это не про уши. Тела кроликов вызывают некоторые вопросы, ну, и, конечно, уши. Хотя, мне нравится это перфоманс с тремя ушами, выглядит интересно, но это все-таки не кролики в обычном их понимании. Если пройтись в целом по промту, то можно заметить, что стилистика плоская и мультяшная; сами кролики стоят на земле, а не в воде; ограниченная цветовая палитра; нет костров и светящихся глаз; нет разбросанной моркови. Картинка не проходит по большинству пунктов и содержит лишь базовые элементы, но по своей сути отличается по стилю и деталям.


Как видите, у каждой из рассмотренных нейросетей есть свои сильные и слабые стороны. Некоторые из них лучше справляются с передачей стиля, другие — с детализацией, третьи — с работой со светом и тенью.









 
  • Теги
    нейросети
  • Сверху Снизу