Заменили фотостоки на Midjourney + Stable Diffusion: 300 картинок за 10 дней, $60

Автор кейса: Олег Вишневский Цифровой дизайнер и арт-директор, мультидисциплинарная команда 15 Март 2024

Для каталога женских косметических товаров фотостоки оказались не вариант. Лицензии под чувствительный контент строгие, консистентность образов между категориями нужна, и счёт идёт на сотни картинок. Решили генерировать всё с нуля. Команда мультидисциплинарная, я как арт-директор разделил задачу на три потока.

Первый поток — фотореалистичные персонажи на Midjourney v6. Ставится промпт под стилистику, описывается персонаж — возраст, эмоции, окружение, детали. Стилевой референс даём через `--sref` с URL картинки. Дальше итерации: десятки генераций, правки промпта, апскейл, доработка в Photoshop Generative Fill, каталогизация в Figma. Рабочий промпт выглядит так: «40 year old woman model posing and smiling in front of a solid, pink colored background, photographic style». На первый экран каждой категории получили по такой картинке — всего 50+ штук.

Второй поток — серии с одним персонажем для анимированного блока «история». Тут у Midjourney без особых костылей не получалось держать одно лицо в разных сценах, и мы ушли в Stable Diffusion. Стек: сборка Automatic1111, модель Realistic Vision V6.0, расширения ControlNet и After Detailer. Стоковые фото с нужными позами прогоняли через ControlNet, получали набор моделей, потом — целевые изображения. Промпт: «Fit and beautiful 45 year old american woman, smiling, brunette tomboy cut, regular fit shirt, clear pastel pink background, RAW photo, subject, 8k uhd, dslr, soft lighting, high quality, film grain, Fujifilm XT3». Негативный включал деформированные глаза, 3D-рендеры, артефакты JPEG.

Лайфхак, сильно ускоривший работу: на одной картинке склеивали по три персонажа, чтобы держать одежду и аксессуары между генерациями. С автоматизацией через Script команда выдала около 70 персонажей за пару ночей. Всего на этот поток ушло примерно 200 изображений.

Третий поток — пак 50+ 3D-иконок в единой стилистике. Решает `--seed`: генерируем первую иконку с промптом «pastel minimalistic purple [объект] icon, front view, trendy design, blender, studio lighting, ultra-minimalist appearance», получаем seed через реакцию-конверт в Discord, и дальше подставляем новый объект, сохраняя seed. Это даёт единый цвет и стиль для всего набора. После — общая цветокоррекция по пакету и нарезка в Figma.

По цифрам. На выходе — больше 300 финальных уникальных картинок. По пути — 2000+ генераций и вариантов: брак неизбежен, доходишь до нужного через перебор. Время команды — около 50 часов. Деньги — $60 за Midjourney Pro Plan на пиковый месяц. Весь проект целиком уложился в 10 дней.

Что не понравилось. Освоить нейросети — это вход. Без понимания, как промпт связан с результатом, и без терпения к итерациям ничего не получится. Брак — нормальная часть процесса, но он тормозит. Мелкие недочёты приходится доделывать руками в Photoshop — пальцы, глаза, тени, отдельные артефакты.

Что выиграли. Лицензии перестали быть проблемой — для медицинских и косметических продуктов это критично, любой стоковый портрет требует отдельного разрешения, а сгенерированный — твой. Гибкость на уровне «нужна та же модель в другом ракурсе» теперь решается за час, не за неделю поиска новой съёмки. И со временем процесс ускоряется — в следующих проектах уже знаешь, какой стек что закрывает. На сайт сверху сложили видеофутажи и 3D-визуализации для каждого продукта.