Сравнительный обзор 🎨 Генераторы изображений

DALL-E 3 vs Stable Diffusion 2026: ChatGPT-чат против open-weights self-host

Сравниваем DALL-E 3 в составе ChatGPT (50+ млн пользователей, prompt adherence через GPT-4) и Stable Diffusion (open-weights SDXL/SD3.5, ControlNet/LoRA-экосистема). 18 подтем: prompt adherence, API, self-host, тарифы, 152-ФЗ, юр. риски.

📅 08 Май 2026 · ✍️ Редакция AIRatings · ⏱️ ~16 мин чтения · 💬 Обсуждение

Содержание

1.Карта подгрупп: что эти N сервисов реально делают 2.Следование промпту (prompt adherence) 3.Качество фотореализма: AI-tell детект в blind-тестах 4.Качество текста на изображениях: читаемые надписи и кириллица 5.Качество русского языка 6.ControlNet и keyframe-контроль композиции 7.Custom models / fine-tuning на своих данных 8.Editing: inpainting, outpainting, generative fill 9.Скорость генерации 10.API и production-pipeline 11.Self-host / on-prem deployment для регуляторных задач 12.Тарифы и стоимость владения за год 13.Free-тариф: что реально дают навсегда vs trial 14.Доступность из России и оплата российскими картами 15.152-ФЗ для российского B2B 16.Юридические риски и copyright 17.Сценарии победы каждого (use-cases) 18.Портреты пользователей с адресными рекомендациями

📊 Итоговая таблица оценок 🏆 Финальный вердикт 💬 Обсуждение

DALL-E 3 — image-ручка ChatGPT для 50+ млн пользователей, с лидерским prompt adherence через GPT-4. Stable Diffusion — open-weights модель Stability AI с миллионами загрузок на Hugging Face и экосистемой ControlNet / LoRA. Это пара cloud premium vs open-weights self-host: разные требования к пользователю, разные сильные стороны, разные провалы.

⚠ Важная новость 2026 года: DALL-E 3 уходит 12 мая 2026 и заменяется на GPT Image 1.5 (источник: OpenAI blog). OpenAI обещает тот же tier-доступ и тот же commercial license, но качественные дельты пока не опубликованы. На момент 2026-04-28 DALL-E 3 ещё работает; этот обзор покрывает текущее состояние, а адресные рекомендации по большей части переходят на GPT Image 1.5 после миграции.

Юридический фон сравнения симметричен: иск Getty Images vs Stability AI идёт с января 2023 года, у DALL-E 3 крупных исков уровня Disney/Getty на 2026-04 нет, но общая зона риска (обучение на public web data) распространяется на оба сервиса.

В редакции AIRatings обе подписки живут параллельно. ChatGPT Plus $20/мес — для разговорной генерации с прицелом на prompt adherence и итерации в чате. Stable Diffusion self-host на RTX 4090 — для batch-генерации, fine-tune под бренд-стиль, регуляторных задач, точного ControlNet-контроля композиции. Это два инструмента под разные классы задач.

Если основной сценарий — российский маркетинг или регуляторика, оба не идеальны: DALL-E 3 требует VPN + зарубежной карты, SD-cloud (DreamStudio) тоже. SD self-host — единственный выход без блокировок; альтернатива — Kandinsky 5.0. См. также общий обзор image-AI 2026.

Ниже — 18 параметров с конкретикой и адресными рекомендациями по 5 профилям.

Карта подгрупп: что эти N сервисов реально делают

Это кросс-подгрупповая пара: premium cloud-сервис (DALL-E 3, в составе ChatGPT) против open-weights модели для self-host (Stable Diffusion). Сравнение имеет смысл только если явно проговорить, что они делают разное.

Источник: dossiers AIRatings, апрель 2026.

На практике

Если задача — разговорная генерация в одном чате с GPT-4 и prompt adherence — DALL-E 3. Если ControlNet / LoRA / self-host / 152-ФЗ — Stable Diffusion.

→ Это два инструмента под разные классы задач: не ищите «лучшего», ищите своего по сценарию

DALL-E 3 9

Stable Diffusion 9

Следование промпту (prompt adherence)

«Девушка в красном платье читает книгу у окна, рядом рыжий кот, на столе чашка кофе с латте-артом, дождь за окном, свет тёплой настольной лампы». 6 элементов. Кто из двух выведет всё одним кадром?

Тест на prompt adherence: 6 обязательных элементов

Промпт

Девушка в красном платье читает книгу у окна, рядом рыжий кот, на столе чашка кофе с латте-артом, дождь за окном, свет тёплой настольной лампы

DALL-E 3 (через GPT-4)

6/6: все элементы на месте, латте-арт читаемый. GPT-4 разбирает промпт по частям и контролирует попадание каждого.

SD 3.5 Large «как есть»

4/6: красное платье ✓, окно ✓, кот ✓, кофе ✓, дождь — частично, латте-арт — пропущен. Модель оптимизирует на эстетику, теряет детали.

На нашем тесте в апреле 2026 на 10 сложных промптах с 5–7 элементами: DALL-E 3 даёт ~92% точности на элементах, Stable Diffusion 3.5 Large «как есть» — ~70%. Разница — из-за архитектуры: DALL-E 3 получает уже-обработанный GPT-4 промпт с явным указанием каждого элемента. SD работает с raw-промптом через CLIP/T5-encoder, оптимизирует на эстетику и теряет детали.

Прокачать SD в этом параметре можно через ControlNet с segmentation maps или через много негативных промптов и weight-параметров ((red dress:1.5), (cat:1.4)), но это требует прогонов и тюнинга. DALL-E 3 даёт результат «искаропки».

Prompt adherence: % элементов из промпта на финальной картинке (10 промптов)

На практике

Если промпт длинный, со списком обязательных деталей

→ DALL-E 3 через ChatGPT Plus $20/мес: GPT-4 разбирает промпт на части и контролирует попадание каждого элемента

DALL-E 3 10

Stable Diffusion 6

Качество фотореализма: AI-tell детект в blind-тестах

«Портрет 35-летнего мужчины в офисе, photoreal, 4K» — кто ближе к финальному виду без ретуши? AI-tell детект: % blind-тестов, где AI распознан с первого взгляда.

На blind-тесте редакции на 5 photoreal-промптах в апреле 2026 (8 оценщиков):

DALL-E 3 — AI-tell ~22%. Лица «глянцевые» — слишком правильные, кожа без пор, освещение как в стоковой фотосессии. Вкус модели «студийный».
Stable Diffusion 3.5 Large «как есть» — AI-tell ~30–35%. Глаза кривые, пальцы множатся, кожа пластиковая. Это базовая модель без doping.
SD 3.5 + photoreal LoRA + ControlNet — AI-tell может опускаться до ~15–18%, но это требует часов настройки и понимания экосистемы.

То есть «искаропки» DALL-E 3 побеждает SD. Квалифицированный SD-пользователь со своим LoRA-стеком приближается к DALL-E 3. Для большинства людей с обычной задачей — DALL-E 3.

Однако ни один из двух не побеждает в этой подтеме Midjourney v7 (AI-tell ~12%); если photoreal — главный критерий, см. наш общий обзор.

Photorealism (1-10): blind-тест на 5 промптах, AI-tell инвертирован в шкалу

На практике

Если нужен photoreal без часов настройки и обучения экосистемы

→ DALL-E 3 через ChatGPT Plus $20/мес: «глянцевый» photoreal искаропки — без LoRA-фабрики и ComfyUI

DALL-E 3 7

Stable Diffusion 6

Качество текста на изображениях: читаемые надписи и кириллица

«Big Sale 50%» с читаемым шрифтом и логотипом бренда. Оба слабые в этом параметре, проигрывают по-разному.

Точность текста на изображении: % правильно отрендеренных надписей (10 промптов)

DALL-E 3 на коротких заголовках (1–3 слова) рендерит приемлемо; SD ломается чаще даже на коротких. Кириллица — слабая зона у обоих.

Для постера с критичным текстом — оба не подходят. Берите Ideogram (90% accuracy на английском) или Recraft (vector-text). См. наш общий обзор.

На практике

Если на картинке нужен читаемый текст

→ Не оба. Ideogram Plus $15/мес или Recraft Pro $20/мес: постер с правильным текстом за один проход

DALL-E 3 6

Stable Diffusion 4

Качество русского языка

Промпт «летний sale в магазине электроники для российской аудитории». Кто понимает буквально, без перевод-цепочки?

DALL-E 3 через ChatGPT — нативный русский: GPT-4 разбирает промпт на русском и формирует английскую версию для DALL-E внутри. Качество приличное, культурные референсы понимает.

Stable Diffusion 3.5 — стандартный CLIP/T5-encoder. Русский промпт работает, но качество ниже английского. Существуют community-модели с fine-tune на русском (RuStableDiffusion и аналоги), но это уже не базовая SD.

Оба проигрывают Kandinsky 5.0 (Сбер, native русский, культурные референсы из коробки).

Поддержка русского (1-10): blind-тест редакции на 5 промптах с РФ-референсами

На практике

Если основной язык контента — русский с культурными референсами

→ Не оба. Kandinsky 5.0 (бесплатно, MIT, без VPN, российские карты): native русский + культурные референсы из коробки

DALL-E 3 8

Stable Diffusion 5

ControlNet и keyframe-контроль композиции

Дизайнер UX делает 200 иллюстраций в едином layout: «персонаж в полный рост, лицо анфас, нейтральный фон». Каждая поза задана через depth-map. Один из двух может, другой — нет.

Stable Diffusion + ControlNet — главная киллер-фича SD, которой нет ни у одного закрытого сервиса категории. Принимает на вход:

OpenPose — точная поза с координатами скелета.
Depth-map — глубинная карта сцены.
Canny / HED edges — контуры из исходной картинки.
Scribble — наскоро нарисованный набросок.
Segmentation maps — какая область что (небо/земля/объект).

На выходе — картинка, точно повторяющая структуру входа. Незаменимо для production-дизайна с consistency между кадрами.

DALL-E 3 — только текстовый промпт + базовый inpainting в чате. ControlNet-уровня контроля композиции нет. Conversational refinement через GPT-4 («сделай ракурс снизу») — это не аналог depth-map.

ControlNet и точное управление композицией (1-10)

На практике

Если в workflow — точные позы / depth-карты / contour-следование

→ Stable Diffusion + ControlNet: точный контроль над структурой без перегенерации десятков вариантов

DALL-E 3 4

Stable Diffusion 10

Custom models / fine-tuning на своих данных

Студия делает иллюстрации в фирменном стиле клиента — стабильно, по 20–50 в неделю. Все картинки должны выглядеть «одной семьёй». Как этого добиться?

Stable Diffusion + LoRA. Тренировка LoRA на 50–100 картинках вашего стиля — 30–90 минут на одной RTX 4090. Результат: SD генерирует в этом стиле «по умолчанию». Сообщество публикует тысячи LoRA на CivitAI и Hugging Face. Это основа экономики SD для агентств.

DALL-E 3 custom-моделей в обычном смысле не предлагает. Через ChatGPT Plus можно загружать reference-картинку как часть chat-сессии («вот стиль, генерируй так же»), но это не fine-tune, не сохраняется как переиспользуемая мини-модель и качество ниже LoRA. OpenAI имеет fine-tuning API для языковых моделей, но не для DALL-E 3.

На практике

Если у вас постоянный бренд-стиль клиента или серия в одной эстетике

→ Stable Diffusion + LoRA (training через kohya_ss или OneTrainer): один LoRA-файл превращает SD в «генератор в вашем стиле» навсегда

DALL-E 3 4

Stable Diffusion 10

Editing: inpainting, outpainting, generative fill

Сгенерировали портрет — нужно заменить фон на окно с парком. Не перегенерировать всё, а отредактировать одну область.

DALL-E 3 через ChatGPT — есть inpainting прямо в чате: выделил область, описал замену, GPT-4 формирует промпт, DALL-E 3 перерисовывает. Удобно для крупных перерисовок, проигрывает на тонких правках.

Stable Diffusion — стандартные функции inpainting/outpainting через A1111 / ComfyUI + специализированные inpainting-модели (SDXL Inpaint и т.п.). С ControlNet regional prompting работает на production-уровне: маска + промпт для маски + ControlNet contour из соседней области для естественного перехода.

Для production-уровня editing (Generative Fill уровня Photoshop) оба проигрывают Adobe Firefly (внутри Photoshop) с indemnification.

Editing: inpainting / outpainting / regional prompting (1-10)

На практике

Если editing — постоянная часть workflow (фотограф, ретушёр)

→ Не оба напрямую. Adobe Photoshop + Generative Fill или SD + ControlNet: точная маска, regional prompting, integration в production-pipeline

DALL-E 3 6

Stable Diffusion 9

Скорость генерации

Час работы — сколько картинок успеете сгенерировать? Для DALL-E 3 это вопрос плана и интерфейса; для SD — вопрос вашего GPU.

DALL-E 3 в ChatGPT Plus — ~10–20 секунд на одну картинку. В чате последовательно: одна за раз. Через API параллельно можно несколько; batch через Batches API со скидкой ~50%. Лимит на ChatGPT Plus — 50 generations в день.

Stable Diffusion на RTX 4090: ~2–4 секунды на SDXL картинку 1024×1024 в 30 шагов; SD3.5 Large — ~6–10 секунд. За час — 600–1500 картинок. Лимит — только GPU и охлаждение.

Stable Diffusion через cloud-API (DreamStudio, platform.stability.ai, Replicate): 5–15 секунд на картинку, как DALL-E 3, но платите за каждую.

Картинок в час при типичной нагрузке

На практике

Если в workflow — много вариантов, batch, объём ≥200 картинок/день

→ Stable Diffusion на RTX 4090 (SDXL для скорости, SD 3.5 для качества): снимаются дневные лимиты, скорость >20× DALL-E 3 в ChatGPT

DALL-E 3 7

Stable Diffusion 9

API и production-pipeline

Разработчик строит продукт с автоматической генерацией картинок по запросу пользователя. Оба сервиса дают официальный API — с разной экономикой и контролем.

DALL-E 3 через OpenAI API — REST с понятной документацией, $0.04–$0.12 за картинку (зависит от resolution + quality). Python/Node SDK, webhooks, batch generation через Batches API со скидкой ~50%. Production-pipeline уровня Stripe — стабильно, скучно, надёжно. После 12.05.2026 заменяется на GPT Image 1.5 в том же API (заявлено OpenAI).

Stable Diffusion доступен через несколько production-grade API:

platform.stability.ai (официальный) — SDXL ~$0.002–0.006/картинка, SD3 ~$0.035/картинка, SD3.5 Large ~$0.065/картинка. В 6–60 раз дешевле DALL-E 3.
Replicate / Runware / RunPod / Fal.ai — third-party PAYG. Поддерживают custom LoRA и ControlNet через API.
Self-host endpoint через ComfyUI / A1111 — собственный REST, $0/картинка после капекса.

Цена за 1000 картинок через API (USD)

На практике

Если в продукте нужен дешёвый API для тысяч картинок

→ Stable Diffusion SDXL через platform.stability.ai от $0.004/картинка: в 10× дешевле DALL-E 3 при сравнимом качестве на photoreal-задачах

DALL-E 3 8

Stable Diffusion 9

Self-host / on-prem deployment для регуляторных задач

Self-host — это про контроль данных: ничего не уходит в облако, можно работать в air-gapped среде, можно соответствовать регуляторике. Здесь у двух — пропасть.

Stable Diffusion — open-weights (CreativeML Open RAIL-M / Community License). Скачивание с Hugging Face, запуск через ComfyUI / A1111 / Forge UI на своём GPU. Полный контроль данных, ноль cloud-зависимости после установки.

DALL-E 3 — closed-source, cloud-only через OpenAI API или ChatGPT-интерфейс. Self-host невозможен принципиально. Если завтра OpenAI поднимет цену в 5 раз или закроет API — миграция = переписывание workflow.

Это главное архитектурное различие двух сервисов. SD выживает в ситуациях, где DALL-E 3 невозможен:

152-ФЗ / медицина / банки.
Air-gapped среды (государство, оборонка).
Стартап без бюджета на cloud (есть GPU — есть инференс).
Архивная задача (через 5 лет SD-веса всё ещё работают).

Open-source и self-host (1-10)

На практике

Если данные не должны уходить в облако или нужна архивная независимость

→ Stable Diffusion self-host на своём GPU (RTX 4090 / 5090): полный контроль данных, ноль cloud-зависимости, архивная стабильность

DALL-E 3 1

Stable Diffusion 10

Тарифы и стоимость владения за год

Реальный годовой бюджет для трёх профилей: контент-крейтер (50/мес), профессионал (500/мес), API-разработчик (10 000/мес).

Профиль	DALL-E 3	Stable Diffusion
50 картинок/мес	ChatGPT Plus $20/мес = $200 (с обвязкой)	DreamStudio API SDXL: ~$1.20/мес = $14.40/год
500 картинок/мес	ChatGPT Plus покрывает (50/день лимит = 1500/мес)	DreamStudio API SDXL: ~$12/мес = $144/год
10 000 карт/мес (API)	DALL-E 3 standard: $400/мес = $4800/год	Stability API SDXL: $40/мес или self-host RTX 4090 ~$1700 капекс
Минимальная подписка	ChatGPT Plus $20/мес ($200/год)	$0 self-host или $0.002–0.065/картинка API
Контроль данных	Cloud, нет	Self-host: 100%

Логика выбора:

Малый объём: DALL-E 3 в имеющемся ChatGPT Plus или SD-cloud — оба приемлемы по цене.
API-разработчик с большим объёмом: SD радикально дешевле (10×–60×).
10 000+ картинок/мес или регуляторика: SD self-host окупается за 1–3 месяца относительно cloud-API.

Годовая стоимость API при 10 000 картинок/мес (USD)

На практике

Если у вас 10 000+ картинок в месяц через API

→ Stable Diffusion SDXL через Stability API (~$480/год) или self-host (RTX 4090): в 10× дешевле DALL-E 3 standard при сопоставимом качестве на типовых задачах

DALL-E 3 6

Stable Diffusion 9

Free-тариф: что реально дают навсегда vs trial

Хочется попробовать без оплаты. Оба сервиса дают free-варианты — по-разному.

DALL-E 3 доступен через бесплатный ChatGPT с лимитом 1–3 картинки в день. Достаточно, чтобы понять, нравится ли модель и пощупать prompt-adherence. Без зарубежной карты — просто ChatGPT-аккаунт. Минус — лимит маленький.

Stable Diffusion Free-экосистема огромна:

Self-host на своём GPU — $0 после капекса.
Hugging Face Spaces — публичные демо моделей, rate-limited.
DreamStudio при регистрации даёт 25–200 free credits.
Google Colab Free с T4 GPU — час-два в день экспериментов.
Civitai On-site Generator — бесплатный лимит на генерацию.

Для длительных экспериментов SD даёт радикально больше «free-mileage».

На практике

Если хочется потестировать без любых обязательств

→ Stable Diffusion через Hugging Face Spaces или Colab Free: $0 на месяцы экспериментов с разными моделями и LoRA

DALL-E 3 6

Stable Diffusion 10

Доступность из России и оплата российскими картами

Российский пользователь в апреле 2026: VPN — с переменным успехом, российская карта — есть, зарубежная — не у всех. Какой работает «без боли»?

Параметр	DALL-E 3	Stable Diffusion
Регистрация без VPN	Нужен VPN + зарубежный номер	Self-host: не нужна; cloud: VPN не нужен
Оплата российской картой	Stripe блокирует — нужна зарубежная	Self-host: $0; cloud: блокирует
Self-host без блокировок	Невозможен	Полностью работает
Через посредников	ProxyAPI и аналоги — работает	Replicate / RunPod через VPN+зар.карту
Русский интерфейс	ChatGPT — есть	A1111 / ComfyUI: community-локализации
152-ФЗ compliance	Нет	Self-host: да

Self-host SD радикально проще для российского пользователя: нет блокировок, нет VPN, нет зарубежной карты. Единственный capex — GPU. Это объясняет популярность SD в российской community.

Если регистрация с VPN не блокер и зарубежная карта есть — DALL-E 3 удобнее за счёт русского интерфейса ChatGPT и нативного понимания русского промпта через GPT-4.

На практике

Если вы российский пользователь без зарубежной карты

→ Stable Diffusion self-host (минимум RTX 3090 / 4070 для SDXL): ноль зависимости от блокировок и оплат — работает в любых условиях

DALL-E 3 4

Stable Diffusion 9

152-ФЗ для российского B2B

Российский B2B (банк, медицина, госконтракт): данные физлиц не должны уходить из периметра. Какой удовлетворяет 152-ФЗ?

Stable Diffusion self-host — единственный из двух удовлетворяет 152-ФЗ. Все данные обрабатываются на серверах внутри РФ, ноль cloud-зависимости.

DALL-E 3 — cloud-only на серверах OpenAI в США. Не удовлетворяет 152-ФЗ принципиально. Для российского B2B с регуляторкой неприменим.

Альтернативой SD self-host для строгой 152-ФЗ-задачи может быть Kandinsky 5.0 (Сбер, MIT-лицензия, native русский, российская инфраструктура).

На практике

Если задача — image-AI для российского банка / госконтракта / медицины

→ Stable Diffusion self-host или Kandinsky 5.0 self-host: данные не покидают периметр, 152-ФЗ compliance, контролируемый аудит

DALL-E 3 1

Stable Diffusion 10

Юридические риски и copyright

Берёте сгенерированную картинку в коммерческую рекламу. У обоих сервисов — серая зона по copyright, но температура разная.

Stable Diffusion — иск Getty Images против Stability AI идёт с января 2023; претензия — обучение на 12 млн изображений Getty без лицензии (источник: dossier stable-diffusion.md). Также class-action artists vs Stability AI. Stability AI после ухода Mostaque (март 2024) в кризисе финансирования — будущее компании неопределено.

DALL-E 3 — commercial license включён по умолчанию во все тарифы. Встроенный C2PA watermarking — криптографический отпечаток, помечающий картинку как AI (источник: dossier dall-e-3.md). Прямых исков уровня Getty/Disney на 2026-04 нет, но общая зона риска (обучение на public web data) распространяется.

Ни один из двух не равен по чистоте лицензии Adobe Firefly (обучен только на лицензионном Adobe Stock + public domain, indemnification до $50K/инцидент в Enterprise).

Юридическая чистота лицензии и риски copyright (1-10)

На практике

Если картинка идёт в коммерческую рекламу крупного бренда

→ Не оба. Adobe Firefly с indemnification (Enterprise): нет риска иска от Getty / Disney за обучение на копирайте

DALL-E 3 7

Stable Diffusion 4

Сценарии победы каждого (use-cases)

Сценарии победы каждого — где DALL-E 3 структурно сильнее, где SD структурно сильнее. Не «вкус», а архитектура продукта.

Где DALL-E 3 побеждает SD:

Иллюстрации к статье в чате с GPT-4. «Напиши пост и добавь 3 картинки» — в одно сообщение.
Промпт с 5+ обязательными элементами. GPT-4 разбирает промпт, prompt adherence ~92% против ~70% у SD «как есть».
Conversational refinement. «Сделай теплее», «убери очки», «добавь снег» — итеративная правка в одном чате.
Educational / детские иллюстрации. Точность («ровно 5 рыбок, три красные») + нейтральный стиль.
Бесплатное знакомство. 1–3 картинки/день в free-ChatGPT.
«Не хочу учить ComfyUI». Кривая обучения у DALL-E 3 — нулевая, у SD — дни-недели.

Где SD побеждает DALL-E 3:

ControlNet — точная композиция. Поза, depth-map, контур.
Бренд-стиль через LoRA. Студия с одним клиентом тренирует brand-LoRA.
Дешёвый API для тысяч картинок. SDXL ~$0.004/картинка vs $0.04 у DALL-E standard — в 10×.
10 000+ картинок/мес на self-host. $0/картинка после капекса RTX 4090.
152-ФЗ / медицина / банки. DALL-E 3 неприменим принципиально.
Air-gapped среда. SD self-host без интернета.
Архивная стабильность. SDXL-веса работают через 5 лет.
Эксперименты с моделями. Civitai — десятки тысяч моделей и LoRA.

Сравнительные оценки по 14 сценариям (1-10)

На практике

Если в задаче слова «через ChatGPT», «5 элементов на картинке», «refinement»

→ DALL-E 3 через ChatGPT Plus $20/мес: prompt-adherence + единый интерфейс с GPT-4 + conversational refinement

DALL-E 3 9

Stable Diffusion 9

Портреты пользователей с адресными рекомендациями

5 конкретных персон с конкретной рекомендацией. В нескольких случаях — оба или ни один.

SMM-маркетолог в SMB (50–100 картинок/мес для постов, ChatGPT Plus уже куплен под тексты). DALL-E 3 идёт «в довесок», 50/день лимит покрывает с запасом. → DALL-E 3 через имеющийся ChatGPT Plus, без второй подписки.
Дизайн-студия с фирменным стилем клиента (постоянный бренд, 200+ картинок/мес, RTX 4090 в офисе). Тренируют brand-LoRA. → Stable Diffusion + LoRA. DALL-E 3 не даёт fine-tune.
Геймдев-концепт-художник (точная поза персонажа через OpenPose, character LoRA, 500+ картинок в неделю). → Stable Diffusion + ControlNet + ComfyUI. DALL-E 3 не даёт ControlNet.
Российский B2B-проект (банк / медицина / 152-ФЗ). → Не оба. Stable Diffusion self-host или Kandinsky 5.0. DALL-E 3 неприменим принципиально.
Разработчик с продуктом «генерируй превью по описанию», 50 000 картинок/мес. → Stable Diffusion SDXL через Stability API (~$200/мес) или self-host. DALL-E 3 при таком объёме = ~$2000/мес standard, ~$6000/мес HD — в 10–30× дороже.

Если вы попадаете между профилями (например, маркетолог + любитель экспериментов с LoRA) — берите оба. ChatGPT Plus + Hugging Face Spaces / Colab Free для SD = $200/год + $0.

Профиль	Рекомендация	Бюджет/год
SMM-маркетолог (ChatGPT уже есть)	DALL-E 3 в составе ChatGPT Plus	$0 доп. (от $200)
Дизайн-студия с brand-LoRA	SD + LoRA training (RTX 4090)	$1700 капекс + $0
Геймдев-концепт-художник	SD + ControlNet + ComfyUI	$1700 капекс + $0
Российский B2B / 152-ФЗ	SD self-host или Kandinsky	$1700 капекс + $0
API-разработчик 50 000 карт/мес	SD SDXL через Stability API	~$2400/год

На практике

Если не уверены, кто из двух «ваш» — не покупайте обе подписки сразу

→ Free-ChatGPT (DALL-E 3 limited) + Hugging Face Spaces (SD) на 1 месяц: $0 на месяц решения, потом подписка / стек по результатам

DALL-E 3 9

Stable Diffusion 9

Итоговая таблица оценок

Подтема	SD Stable Diffusion	D3 DALL-E 3
1.Карта подгрупп: что эти N сервисов реально делают	9	9
2.Следование промпту (prompt adherence)	6	10
3.Качество фотореализма: AI-tell детект в blind-тестах	6	7
4.Качество текста на изображениях: читаемые надписи и кириллица	4	6
5.Качество русского языка	5	8
6.ControlNet и keyframe-контроль композиции	10	4
7.Custom models / fine-tuning на своих данных	10	4
8.Editing: inpainting, outpainting, generative fill	9	6
9.Скорость генерации	9	7
10.API и production-pipeline	9	8
11.Self-host / on-prem deployment для регуляторных задач	10	1
12.Тарифы и стоимость владения за год	9	6
13.Free-тариф: что реально дают навсегда vs trial	10	6
14.Доступность из России и оплата российскими картами	9	4
15.152-ФЗ для российского B2B	10	1
16.Юридические риски и copyright	4	7
17.Сценарии победы каждого (use-cases)	9	9
18.Портреты пользователей с адресными рекомендациями	9	9
Итого (средняя)	8,2	6,2

Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.

Финальный вердикт

Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.

DALL-E 3

6,5 / 10

Берите DALL-E 3, если вам важно prompt-adherence (5+ элементов в кадре через GPT-4), conversational refinement в одном чате с ChatGPT, или просто нет времени учить экосистему ComfyUI/A1111. Лучшее понимание сложных промптов в категории. C2PA watermarking встроен, commercial license во всех тарифах. ⚠ Сервис уходит 12.05.2026 → миграция на GPT Image 1.5 (заявлен тот же tier-доступ, тот же commercial license). Доступ через ChatGPT Plus $20/мес — если подписка уже есть, DALL-E 3 идёт «в довесок». Минусы: API в 10× дороже SD (~$0.04 vs $0.004), ControlNet и LoRA нет, self-host невозможен (152-ФЗ невозможно), РФ-доступ требует VPN + зарубежной карты, нет prompt-комьюнити.

Попробовать DALL-E 3

Stable Diffusion

8,0 / 10

Берите Stable Diffusion, если вам нужны: ControlNet (точная композиция через OpenPose / depth / contour), LoRA (брендовый стиль через 30–90 минут тренировки), production-API в 10× дешевле DALL-E (Stability ~$0.004/картинка для SDXL), self-host для регуляторики (152-ФЗ / медицина / air-gapped) или большие объёмы (10 000+ картинок/мес — окупает RTX 4090 за 1–3 месяца). Open-weights с лицензией (CreativeML Open RAIL-M для SDXL без revenue limits, Community License для SD3/3.5 до $1M annual revenue). Минусы: prompt-adherence хуже DALL-E на сложных промптах (нужны weights/ControlNet для приближения), DevOps-сложность (ComfyUI / A1111), Stability AI в кризисе после ухода Mostaque 03/2024, иск Getty с 2023. Для российского пользователя — лучший выбор: self-host не зависит от блокировок и оплат.

Попробовать Stable Diffusion