Искусственный интеллект «с ноги» ворвался в повседневную жизнь креативного класса и технарей, но вопреки паники, я думаю, что он станет скорее инструментом, чем заменой. К этому выводу я пришел, когда решил использовать его в своей работе. Как один из результатов моего теста – обзор на сервисы на базе ИИ, которые могут генерировать изображения. И обзор я написал именно с колокольни SMM специалиста, которому регулярно и много нужны картинки, вот и нейросети тут как нельзя кстати.
Midjourney
Первым на очереди будет «миджоурней», собственно я с ним и познакомился впервые как с инструментом генерации изображений с помощью ИИ. Сначала он мне показался забавным, не более того, но позже я увидел как его используют другие и понял, что это неиссякаемый источник контента. Во-первых, все еще актуальны по посты в духе «как нейросеть видит что-либо». Они конечно со временем изживут себя и в целом притянуты за уши, потому что нейросети никак не видят мир, они генерируют изображения по запросам, но тем не менее, людям интересно, как герб города или какую-то песню видит ИИ.
Midjourney идеален для начала работы с ии, тут можно нагенерировать рекламных креативов для промо, картинок для постов.
Сам процесс работы генерации простой, вся работа происходит через Discord, куда вы пишете ваши подсказки, бот отправляет вам 4 варианта, а вы можете выбрать один и сгенерировать из него еще 4 варианта или попросить сделать еще других варианта. Но у человека, без опыта работы с Discord, могут возникнуть вопросы.
Даже к некоторым постам в этом блоге я с помощью Midjourney сгенерировал картинки, так как подходящих вариантов не смог найти.
Итак, ниже моя субъективная оценка Midjourney, в целом я сейчас им не пользуюсь, так как уже основные потребности закрыл, но не исключаю, что когда накопится объем задач для него, я куплю месячную подписку и закрою эти задачи. Кстати, один из минусов (в итогах я его указал) управление процессом происходит через чат бот и, например, чтобы сделать картинку нужного размера (причем сделает почти любого в пикселях), нужно в конце запроса сделать пробел и указать следующий параметр —ar 770:330 (где 770:330 это ширина и высота картинки в пикселях). Целиком запрос будет выглядеть как на примере ниже (кстати, это я генерировал картинку для этой новости).
DALL·E 2
DALL·E 2 от создателей Chat GPT (компания Open AI). Это один из первых инструментов, который генерировал изображения, но, к сожалению, далеко он не развился. Сегодня он умеет делать изображения, которые безошибочно можно определить как те, что сгенерировала бездушная машина. С другой стороны, если не воспринимать его работу как конечный результат, то можно использовать DALL-E как инструмент для референсов, чтобы формировать мудборды, раскадровки и просто визуализировать идеи. Тогда вы быстро можете накидать разные варианты композиций и образов. Тем более, что «Долли» можно использовать бесплатно, в отличие от Midjourney, который полностью убрал возможность бесплатно генерировать изображения.
Ниже примеры моих генераций на тему «гуру SMM», вышло очень криво в деталях, но зато можно вдохновиться (что я и сделал) и взять на заметку пару вариантов. А картинки с бургерами в стиле витражей – это я нажал кнопку «удиви меня», чтобы понять получше его возможности и в принципе, по этим запросам он нарисовал вполне сносно. Только не очень применимо в моем случае.
Lexica
Lexica один из вариантов, который сильно меня удивил в плане качества картинки. Я далеко от искусства, но у «Лексика» прослеживается свой какой-то стиль картинок. Они выглядят как 4К обои на телефон (я себе, кстати, нагенерил обои на телефон с помощью Lexica). Еще в Lexica явно загнались и сделали удобный интерфейс. И огромный плюс, что можно делать картинки разных размеров (ориентации), но размеры все равно не популярные в социальных медиа. Это первый сервис, от которого я прямо кайфанул и подумал, что результаты можно выкладывать прямо так, без доработки. Конечно, как и все, он плохо работает с текстом (но лучше других, буквы ровнее, иногда прорисовываются целые отдельные слова).
И еще с Lexica удобнее искать идеи, потому, что есть возможность поиска стиля, где сервис отдает сразу много разных вариантов, тогда как большинство отдает по 4 варианта и все. И еще один весомый плюс – Lexica хорошо рисует популярных людей, вы можете сделать аниме версию Гарри Поттера, например. А тут решил поиграть с Lexica на тему визуализации SMMщика, например, если бы Гарри Поттер им был, а на втором варианте должен быть Лев Толстой, но что-то не очень похож. Ну и самый полезный блок в Lexica – варианты размеров картинки. По дефолту изображения делаются вертикальными, но можно сделать и квадратные.
Dream by WOMBO
Dream by WOMBO – заточен строго под генерацию контента для социальных сетей, о чем говорят его возможности. Вы можете сгенерировать фото и видео для Tik Tok или квадратную картинку для поста в Instagram, прямоугольную картинку для Twitter и других социальных сетей (16:9).
Также у сервиса есть мобильное приложение как на iOS, так и на Android. Удобно для тех, кто всю работу делает на телефоне.
Покупать этот сервис я не стал, пользовался бесплатной версией, потому что платить за чуть-чуть допиленный DALL-E желания нет, по-моему это выкинутые деньги. Если бы он рисовал, как Midjourney, то тогда это был бы просто очень крутой сервис.
DreamStudio
Неплохой и малоизвестный вариант, который обладает гибкими настройками по генерации изображений. Удобно, что можно заранее выбрать формат изображения. Качество картинки сильно зависит от запросов. Есть негативные запросы к картинке (например, что-либо убрать) и редактор изображения (вы можете ластиком убрать какие-то детали, ИИ заменит их). Именно возможность дорабатывать так изображения, выгодно отличает DreamStudio от других. Ну и есть бесплатные токены, которые можно истратить на тесты.
Итоги и выводы
В итоге я бы выделали 2 лидера: Midjourney и Lexica, возможно в тройку лидеров добавил бы DreamStudio. Использовать ИИ можно для разных постов и креативов, но мне кажется, сегодня это скорее такой полуфабритный вариант, потому что все же живой и нативный контент привлекает людей лучше. А еще ниже сгенерировал картинку по одному и тому же запросу во всех этих ИИ, чтобы наглядно можно было их сравнить. Запрос вполне реальный, для одного теста рекламы связанной с криптовалютами, решил сгенерировать образ персонажа игры Марио, который выбивает монету Bitcoin.