DALL-E 3 vs Stable Diffusion 2026: ChatGPT-чат против open-weights self-host
Сравниваем DALL-E 3 в составе ChatGPT (50+ млн пользователей, prompt adherence через GPT-4) и Stable Diffusion (open-weights SDXL/SD3.5, ControlNet/LoRA-экосистема). 18 подтем: prompt adherence, API, self-host, тарифы, 152-ФЗ, юр. риски.
Содержание
DALL-E 3 — image-ручка ChatGPT для 50+ млн пользователей, с лидерским prompt adherence через GPT-4. Stable Diffusion — open-weights модель Stability AI с миллионами загрузок на Hugging Face и экосистемой ControlNet / LoRA. Это пара cloud premium vs open-weights self-host: разные требования к пользователю, разные сильные стороны, разные провалы.
⚠ Важная новость 2026 года: DALL-E 3 уходит 12 мая 2026 и заменяется на GPT Image 1.5 (источник: OpenAI blog). OpenAI обещает тот же tier-доступ и тот же commercial license, но качественные дельты пока не опубликованы. На момент 2026-04-28 DALL-E 3 ещё работает; этот обзор покрывает текущее состояние, а адресные рекомендации по большей части переходят на GPT Image 1.5 после миграции.
Юридический фон сравнения симметричен: иск Getty Images vs Stability AI идёт с января 2023 года, у DALL-E 3 крупных исков уровня Disney/Getty на 2026-04 нет, но общая зона риска (обучение на public web data) распространяется на оба сервиса.
В редакции AIRatings обе подписки живут параллельно. ChatGPT Plus $20/мес — для разговорной генерации с прицелом на prompt adherence и итерации в чате. Stable Diffusion self-host на RTX 4090 — для batch-генерации, fine-tune под бренд-стиль, регуляторных задач, точного ControlNet-контроля композиции. Это два инструмента под разные классы задач.
Если основной сценарий — российский маркетинг или регуляторика, оба не идеальны: DALL-E 3 требует VPN + зарубежной карты, SD-cloud (DreamStudio) тоже. SD self-host — единственный выход без блокировок; альтернатива — Kandinsky 5.0. См. также общий обзор image-AI 2026.
Ниже — 18 параметров с конкретикой и адресными рекомендациями по 5 профилям.
Карта подгрупп: что эти N сервисов реально делают
Это кросс-подгрупповая пара: premium cloud-сервис (DALL-E 3, в составе ChatGPT) против open-weights модели для self-host (Stable Diffusion). Сравнение имеет смысл только если явно проговорить, что они делают разное.
Источник: dossiers AIRatings, апрель 2026.
Если задача — разговорная генерация в одном чате с GPT-4 и prompt adherence — DALL-E 3. Если ControlNet / LoRA / self-host / 152-ФЗ — Stable Diffusion.
→ Это два инструмента под разные классы задач: не ищите «лучшего», ищите своего по сценарию
Следование промпту (prompt adherence)
«Девушка в красном платье читает книгу у окна, рядом рыжий кот, на столе чашка кофе с латте-артом, дождь за окном, свет тёплой настольной лампы». 6 элементов. Кто из двух выведет всё одним кадром?
Девушка в красном платье читает книгу у окна, рядом рыжий кот, на столе чашка кофе с латте-артом, дождь за окном, свет тёплой настольной лампы
6/6: все элементы на месте, латте-арт читаемый. GPT-4 разбирает промпт по частям и контролирует попадание каждого.
4/6: красное платье ✓, окно ✓, кот ✓, кофе ✓, дождь — частично, латте-арт — пропущен. Модель оптимизирует на эстетику, теряет детали.
На нашем тесте в апреле 2026 на 10 сложных промптах с 5–7 элементами: DALL-E 3 даёт ~92% точности на элементах, Stable Diffusion 3.5 Large «как есть» — ~70%. Разница — из-за архитектуры: DALL-E 3 получает уже-обработанный GPT-4 промпт с явным указанием каждого элемента. SD работает с raw-промптом через CLIP/T5-encoder, оптимизирует на эстетику и теряет детали.
Прокачать SD в этом параметре можно через ControlNet с segmentation maps или через
много негативных промптов и weight-параметров ((red dress:1.5), (cat:1.4)),
но это требует прогонов и тюнинга. DALL-E 3 даёт результат «искаропки».
Если промпт длинный, со списком обязательных деталей
→ DALL-E 3 через ChatGPT Plus $20/мес: GPT-4 разбирает промпт на части и контролирует попадание каждого элемента
Качество фотореализма: AI-tell детект в blind-тестах
«Портрет 35-летнего мужчины в офисе, photoreal, 4K» — кто ближе к финальному виду без ретуши? AI-tell детект: % blind-тестов, где AI распознан с первого взгляда.
На blind-тесте редакции на 5 photoreal-промптах в апреле 2026 (8 оценщиков):
- DALL-E 3 — AI-tell ~22%. Лица «глянцевые» — слишком правильные, кожа без пор, освещение как в стоковой фотосессии. Вкус модели «студийный».
- Stable Diffusion 3.5 Large «как есть» — AI-tell ~30–35%. Глаза кривые, пальцы множатся, кожа пластиковая. Это базовая модель без doping.
- SD 3.5 + photoreal LoRA + ControlNet — AI-tell может опускаться до ~15–18%, но это требует часов настройки и понимания экосистемы.
То есть «искаропки» DALL-E 3 побеждает SD. Квалифицированный SD-пользователь со своим LoRA-стеком приближается к DALL-E 3. Для большинства людей с обычной задачей — DALL-E 3.
Однако ни один из двух не побеждает в этой подтеме Midjourney v7 (AI-tell ~12%); если photoreal — главный критерий, см. наш общий обзор.
Если нужен photoreal без часов настройки и обучения экосистемы
→ DALL-E 3 через ChatGPT Plus $20/мес: «глянцевый» photoreal искаропки — без LoRA-фабрики и ComfyUI
Качество текста на изображениях: читаемые надписи и кириллица
«Big Sale 50%» с читаемым шрифтом и логотипом бренда. Оба слабые в этом параметре, проигрывают по-разному.
DALL-E 3 на коротких заголовках (1–3 слова) рендерит приемлемо; SD ломается чаще даже на коротких. Кириллица — слабая зона у обоих.
Для постера с критичным текстом — оба не подходят. Берите Ideogram (90% accuracy на английском) или Recraft (vector-text). См. наш общий обзор.
Если на картинке нужен читаемый текст
→ Не оба. Ideogram Plus $15/мес или Recraft Pro $20/мес: постер с правильным текстом за один проход
Качество русского языка
Промпт «летний sale в магазине электроники для российской аудитории». Кто понимает буквально, без перевод-цепочки?
DALL-E 3 через ChatGPT — нативный русский: GPT-4 разбирает промпт на русском и формирует английскую версию для DALL-E внутри. Качество приличное, культурные референсы понимает.
Stable Diffusion 3.5 — стандартный CLIP/T5-encoder. Русский промпт работает, но качество ниже английского. Существуют community-модели с fine-tune на русском (RuStableDiffusion и аналоги), но это уже не базовая SD.
Оба проигрывают Kandinsky 5.0 (Сбер, native русский, культурные референсы из коробки).
Если основной язык контента — русский с культурными референсами
→ Не оба. Kandinsky 5.0 (бесплатно, MIT, без VPN, российские карты): native русский + культурные референсы из коробки
ControlNet и keyframe-контроль композиции
Дизайнер UX делает 200 иллюстраций в едином layout: «персонаж в полный рост, лицо анфас, нейтральный фон». Каждая поза задана через depth-map. Один из двух может, другой — нет.
Stable Diffusion + ControlNet — главная киллер-фича SD, которой нет ни у одного закрытого сервиса категории. Принимает на вход:
- OpenPose — точная поза с координатами скелета.
- Depth-map — глубинная карта сцены.
- Canny / HED edges — контуры из исходной картинки.
- Scribble — наскоро нарисованный набросок.
- Segmentation maps — какая область что (небо/земля/объект).
На выходе — картинка, точно повторяющая структуру входа. Незаменимо для production-дизайна с consistency между кадрами.
DALL-E 3 — только текстовый промпт + базовый inpainting в чате. ControlNet-уровня контроля композиции нет. Conversational refinement через GPT-4 («сделай ракурс снизу») — это не аналог depth-map.
Если в workflow — точные позы / depth-карты / contour-следование
→ Stable Diffusion + ControlNet: точный контроль над структурой без перегенерации десятков вариантов
Custom models / fine-tuning на своих данных
Студия делает иллюстрации в фирменном стиле клиента — стабильно, по 20–50 в неделю. Все картинки должны выглядеть «одной семьёй». Как этого добиться?
Stable Diffusion + LoRA. Тренировка LoRA на 50–100 картинках вашего стиля — 30–90 минут на одной RTX 4090. Результат: SD генерирует в этом стиле «по умолчанию». Сообщество публикует тысячи LoRA на CivitAI и Hugging Face. Это основа экономики SD для агентств.
DALL-E 3 custom-моделей в обычном смысле не предлагает. Через ChatGPT Plus можно загружать reference-картинку как часть chat-сессии («вот стиль, генерируй так же»), но это не fine-tune, не сохраняется как переиспользуемая мини-модель и качество ниже LoRA. OpenAI имеет fine-tuning API для языковых моделей, но не для DALL-E 3.
Если у вас постоянный бренд-стиль клиента или серия в одной эстетике
→ Stable Diffusion + LoRA (training через kohya_ss или OneTrainer): один LoRA-файл превращает SD в «генератор в вашем стиле» навсегда
Editing: inpainting, outpainting, generative fill
Сгенерировали портрет — нужно заменить фон на окно с парком. Не перегенерировать всё, а отредактировать одну область.
DALL-E 3 через ChatGPT — есть inpainting прямо в чате: выделил область, описал замену, GPT-4 формирует промпт, DALL-E 3 перерисовывает. Удобно для крупных перерисовок, проигрывает на тонких правках.
Stable Diffusion — стандартные функции inpainting/outpainting через A1111 / ComfyUI + специализированные inpainting-модели (SDXL Inpaint и т.п.). С ControlNet regional prompting работает на production-уровне: маска + промпт для маски + ControlNet contour из соседней области для естественного перехода.
Для production-уровня editing (Generative Fill уровня Photoshop) оба проигрывают Adobe Firefly (внутри Photoshop) с indemnification.
Если editing — постоянная часть workflow (фотограф, ретушёр)
→ Не оба напрямую. Adobe Photoshop + Generative Fill или SD + ControlNet: точная маска, regional prompting, integration в production-pipeline
Скорость генерации
Час работы — сколько картинок успеете сгенерировать? Для DALL-E 3 это вопрос плана и интерфейса; для SD — вопрос вашего GPU.
DALL-E 3 в ChatGPT Plus — ~10–20 секунд на одну картинку. В чате последовательно: одна за раз. Через API параллельно можно несколько; batch через Batches API со скидкой ~50%. Лимит на ChatGPT Plus — 50 generations в день.
Stable Diffusion на RTX 4090: ~2–4 секунды на SDXL картинку 1024×1024 в 30 шагов; SD3.5 Large — ~6–10 секунд. За час — 600–1500 картинок. Лимит — только GPU и охлаждение.
Stable Diffusion через cloud-API (DreamStudio, platform.stability.ai, Replicate): 5–15 секунд на картинку, как DALL-E 3, но платите за каждую.
Если в workflow — много вариантов, batch, объём ≥200 картинок/день
→ Stable Diffusion на RTX 4090 (SDXL для скорости, SD 3.5 для качества): снимаются дневные лимиты, скорость >20× DALL-E 3 в ChatGPT
API и production-pipeline
Разработчик строит продукт с автоматической генерацией картинок по запросу пользователя. Оба сервиса дают официальный API — с разной экономикой и контролем.
DALL-E 3 через OpenAI API — REST с понятной документацией, $0.04–$0.12 за картинку (зависит от resolution + quality). Python/Node SDK, webhooks, batch generation через Batches API со скидкой ~50%. Production-pipeline уровня Stripe — стабильно, скучно, надёжно. После 12.05.2026 заменяется на GPT Image 1.5 в том же API (заявлено OpenAI).
Stable Diffusion доступен через несколько production-grade API:
- platform.stability.ai (официальный) — SDXL ~$0.002–0.006/картинка, SD3 ~$0.035/картинка, SD3.5 Large ~$0.065/картинка. В 6–60 раз дешевле DALL-E 3.
- Replicate / Runware / RunPod / Fal.ai — third-party PAYG. Поддерживают custom LoRA и ControlNet через API.
- Self-host endpoint через ComfyUI / A1111 — собственный REST, $0/картинка после капекса.
Если в продукте нужен дешёвый API для тысяч картинок
→ Stable Diffusion SDXL через platform.stability.ai от $0.004/картинка: в 10× дешевле DALL-E 3 при сравнимом качестве на photoreal-задачах
Self-host / on-prem deployment для регуляторных задач
Self-host — это про контроль данных: ничего не уходит в облако, можно работать в air-gapped среде, можно соответствовать регуляторике. Здесь у двух — пропасть.
Stable Diffusion — open-weights (CreativeML Open RAIL-M / Community License). Скачивание с Hugging Face, запуск через ComfyUI / A1111 / Forge UI на своём GPU. Полный контроль данных, ноль cloud-зависимости после установки.
DALL-E 3 — closed-source, cloud-only через OpenAI API или ChatGPT-интерфейс. Self-host невозможен принципиально. Если завтра OpenAI поднимет цену в 5 раз или закроет API — миграция = переписывание workflow.
Это главное архитектурное различие двух сервисов. SD выживает в ситуациях, где DALL-E 3 невозможен:
- 152-ФЗ / медицина / банки.
- Air-gapped среды (государство, оборонка).
- Стартап без бюджета на cloud (есть GPU — есть инференс).
- Архивная задача (через 5 лет SD-веса всё ещё работают).
Если данные не должны уходить в облако или нужна архивная независимость
→ Stable Diffusion self-host на своём GPU (RTX 4090 / 5090): полный контроль данных, ноль cloud-зависимости, архивная стабильность
Тарифы и стоимость владения за год
Реальный годовой бюджет для трёх профилей: контент-крейтер (50/мес), профессионал (500/мес), API-разработчик (10 000/мес).
| Профиль | DALL-E 3 | Stable Diffusion |
|---|---|---|
| 50 картинок/мес | ChatGPT Plus $20/мес = $200 (с обвязкой) | DreamStudio API SDXL: ~$1.20/мес = $14.40/год |
| 500 картинок/мес | ChatGPT Plus покрывает (50/день лимит = 1500/мес) | DreamStudio API SDXL: ~$12/мес = $144/год |
| 10 000 карт/мес (API) | DALL-E 3 standard: $400/мес = $4800/год | Stability API SDXL: $40/мес или self-host RTX 4090 ~$1700 капекс |
| Минимальная подписка | ChatGPT Plus $20/мес ($200/год) | $0 self-host или $0.002–0.065/картинка API |
| Контроль данных | Cloud, нет | Self-host: 100% |
Логика выбора:
- Малый объём: DALL-E 3 в имеющемся ChatGPT Plus или SD-cloud — оба приемлемы по цене.
- API-разработчик с большим объёмом: SD радикально дешевле (10×–60×).
- 10 000+ картинок/мес или регуляторика: SD self-host окупается за 1–3 месяца относительно cloud-API.
Если у вас 10 000+ картинок в месяц через API
→ Stable Diffusion SDXL через Stability API (~$480/год) или self-host (RTX 4090): в 10× дешевле DALL-E 3 standard при сопоставимом качестве на типовых задачах
Free-тариф: что реально дают навсегда vs trial
Хочется попробовать без оплаты. Оба сервиса дают free-варианты — по-разному.
DALL-E 3 доступен через бесплатный ChatGPT с лимитом 1–3 картинки в день. Достаточно, чтобы понять, нравится ли модель и пощупать prompt-adherence. Без зарубежной карты — просто ChatGPT-аккаунт. Минус — лимит маленький.
Stable Diffusion Free-экосистема огромна:
- Self-host на своём GPU — $0 после капекса.
- Hugging Face Spaces — публичные демо моделей, rate-limited.
- DreamStudio при регистрации даёт 25–200 free credits.
- Google Colab Free с T4 GPU — час-два в день экспериментов.
- Civitai On-site Generator — бесплатный лимит на генерацию.
Для длительных экспериментов SD даёт радикально больше «free-mileage».
Если хочется потестировать без любых обязательств
→ Stable Diffusion через Hugging Face Spaces или Colab Free: $0 на месяцы экспериментов с разными моделями и LoRA
Доступность из России и оплата российскими картами
Российский пользователь в апреле 2026: VPN — с переменным успехом, российская карта — есть, зарубежная — не у всех. Какой работает «без боли»?
| Параметр | DALL-E 3 | Stable Diffusion |
|---|---|---|
| Регистрация без VPN | Нужен VPN + зарубежный номер | Self-host: не нужна; cloud: VPN не нужен |
| Оплата российской картой | Stripe блокирует — нужна зарубежная | Self-host: $0; cloud: блокирует |
| Self-host без блокировок | Невозможен | Полностью работает |
| Через посредников | ProxyAPI и аналоги — работает | Replicate / RunPod через VPN+зар.карту |
| Русский интерфейс | ChatGPT — есть | A1111 / ComfyUI: community-локализации |
| 152-ФЗ compliance | Нет | Self-host: да |
Self-host SD радикально проще для российского пользователя: нет блокировок, нет VPN, нет зарубежной карты. Единственный capex — GPU. Это объясняет популярность SD в российской community.
Если регистрация с VPN не блокер и зарубежная карта есть — DALL-E 3 удобнее за счёт русского интерфейса ChatGPT и нативного понимания русского промпта через GPT-4.
Если вы российский пользователь без зарубежной карты
→ Stable Diffusion self-host (минимум RTX 3090 / 4070 для SDXL): ноль зависимости от блокировок и оплат — работает в любых условиях
152-ФЗ для российского B2B
Российский B2B (банк, медицина, госконтракт): данные физлиц не должны уходить из периметра. Какой удовлетворяет 152-ФЗ?
Stable Diffusion self-host — единственный из двух удовлетворяет 152-ФЗ. Все данные обрабатываются на серверах внутри РФ, ноль cloud-зависимости.
DALL-E 3 — cloud-only на серверах OpenAI в США. Не удовлетворяет 152-ФЗ принципиально. Для российского B2B с регуляторкой неприменим.
Альтернативой SD self-host для строгой 152-ФЗ-задачи может быть Kandinsky 5.0 (Сбер, MIT-лицензия, native русский, российская инфраструктура).
Если задача — image-AI для российского банка / госконтракта / медицины
→ Stable Diffusion self-host или Kandinsky 5.0 self-host: данные не покидают периметр, 152-ФЗ compliance, контролируемый аудит
Юридические риски и copyright
Берёте сгенерированную картинку в коммерческую рекламу. У обоих сервисов — серая зона по copyright, но температура разная.
Stable Diffusion — иск Getty Images против Stability AI идёт с января 2023; претензия — обучение на 12 млн изображений Getty без лицензии (источник: dossier stable-diffusion.md). Также class-action artists vs Stability AI. Stability AI после ухода Mostaque (март 2024) в кризисе финансирования — будущее компании неопределено.
DALL-E 3 — commercial license включён по умолчанию во все тарифы. Встроенный C2PA watermarking — криптографический отпечаток, помечающий картинку как AI (источник: dossier dall-e-3.md). Прямых исков уровня Getty/Disney на 2026-04 нет, но общая зона риска (обучение на public web data) распространяется.
Ни один из двух не равен по чистоте лицензии Adobe Firefly (обучен только на лицензионном Adobe Stock + public domain, indemnification до $50K/инцидент в Enterprise).
Если картинка идёт в коммерческую рекламу крупного бренда
→ Не оба. Adobe Firefly с indemnification (Enterprise): нет риска иска от Getty / Disney за обучение на копирайте
Сценарии победы каждого (use-cases)
Сценарии победы каждого — где DALL-E 3 структурно сильнее, где SD структурно сильнее. Не «вкус», а архитектура продукта.
Где DALL-E 3 побеждает SD:
- Иллюстрации к статье в чате с GPT-4. «Напиши пост и добавь 3 картинки» — в одно сообщение.
- Промпт с 5+ обязательными элементами. GPT-4 разбирает промпт, prompt adherence ~92% против ~70% у SD «как есть».
- Conversational refinement. «Сделай теплее», «убери очки», «добавь снег» — итеративная правка в одном чате.
- Educational / детские иллюстрации. Точность («ровно 5 рыбок, три красные») + нейтральный стиль.
- Бесплатное знакомство. 1–3 картинки/день в free-ChatGPT.
- «Не хочу учить ComfyUI». Кривая обучения у DALL-E 3 — нулевая, у SD — дни-недели.
Где SD побеждает DALL-E 3:
- ControlNet — точная композиция. Поза, depth-map, контур.
- Бренд-стиль через LoRA. Студия с одним клиентом тренирует brand-LoRA.
- Дешёвый API для тысяч картинок. SDXL ~$0.004/картинка vs $0.04 у DALL-E standard — в 10×.
- 10 000+ картинок/мес на self-host. $0/картинка после капекса RTX 4090.
- 152-ФЗ / медицина / банки. DALL-E 3 неприменим принципиально.
- Air-gapped среда. SD self-host без интернета.
- Архивная стабильность. SDXL-веса работают через 5 лет.
- Эксперименты с моделями. Civitai — десятки тысяч моделей и LoRA.
Если в задаче слова «через ChatGPT», «5 элементов на картинке», «refinement»
→ DALL-E 3 через ChatGPT Plus $20/мес: prompt-adherence + единый интерфейс с GPT-4 + conversational refinement
Портреты пользователей с адресными рекомендациями
5 конкретных персон с конкретной рекомендацией. В нескольких случаях — оба или ни один.
- SMM-маркетолог в SMB (50–100 картинок/мес для постов, ChatGPT Plus уже куплен под тексты). DALL-E 3 идёт «в довесок», 50/день лимит покрывает с запасом. → DALL-E 3 через имеющийся ChatGPT Plus, без второй подписки.
- Дизайн-студия с фирменным стилем клиента (постоянный бренд, 200+ картинок/мес, RTX 4090 в офисе). Тренируют brand-LoRA. → Stable Diffusion + LoRA. DALL-E 3 не даёт fine-tune.
- Геймдев-концепт-художник (точная поза персонажа через OpenPose, character LoRA, 500+ картинок в неделю). → Stable Diffusion + ControlNet + ComfyUI. DALL-E 3 не даёт ControlNet.
- Российский B2B-проект (банк / медицина / 152-ФЗ). → Не оба. Stable Diffusion self-host или Kandinsky 5.0. DALL-E 3 неприменим принципиально.
- Разработчик с продуктом «генерируй превью по описанию», 50 000 картинок/мес. → Stable Diffusion SDXL через Stability API (~$200/мес) или self-host. DALL-E 3 при таком объёме = ~$2000/мес standard, ~$6000/мес HD — в 10–30× дороже.
Если вы попадаете между профилями (например, маркетолог + любитель экспериментов с LoRA) — берите оба. ChatGPT Plus + Hugging Face Spaces / Colab Free для SD = $200/год + $0.
| Профиль | Рекомендация | Бюджет/год |
|---|---|---|
| SMM-маркетолог (ChatGPT уже есть) | DALL-E 3 в составе ChatGPT Plus | $0 доп. (от $200) |
| Дизайн-студия с brand-LoRA | SD + LoRA training (RTX 4090) | $1700 капекс + $0 |
| Геймдев-концепт-художник | SD + ControlNet + ComfyUI | $1700 капекс + $0 |
| Российский B2B / 152-ФЗ | SD self-host или Kandinsky | $1700 капекс + $0 |
| API-разработчик 50 000 карт/мес | SD SDXL через Stability API | ~$2400/год |
Если не уверены, кто из двух «ваш» — не покупайте обе подписки сразу
→ Free-ChatGPT (DALL-E 3 limited) + Hugging Face Spaces (SD) на 1 месяц: $0 на месяц решения, потом подписка / стек по результатам
Итоговая таблица оценок
| Подтема |
SD
Stable Diffusion
|
D3
DALL-E 3
|
|---|---|---|
| 1.Карта подгрупп: что эти N сервисов реально делают | 9 | 9 |
| 2.Следование промпту (prompt adherence) | 6 | 10 |
| 3.Качество фотореализма: AI-tell детект в blind-тестах | 6 | 7 |
| 4.Качество текста на изображениях: читаемые надписи и кириллица | 4 | 6 |
| 5.Качество русского языка | 5 | 8 |
| 6.ControlNet и keyframe-контроль композиции | 10 | 4 |
| 7.Custom models / fine-tuning на своих данных | 10 | 4 |
| 8.Editing: inpainting, outpainting, generative fill | 9 | 6 |
| 9.Скорость генерации | 9 | 7 |
| 10.API и production-pipeline | 9 | 8 |
| 11.Self-host / on-prem deployment для регуляторных задач | 10 | 1 |
| 12.Тарифы и стоимость владения за год | 9 | 6 |
| 13.Free-тариф: что реально дают навсегда vs trial | 10 | 6 |
| 14.Доступность из России и оплата российскими картами | 9 | 4 |
| 15.152-ФЗ для российского B2B | 10 | 1 |
| 16.Юридические риски и copyright | 4 | 7 |
| 17.Сценарии победы каждого (use-cases) | 9 | 9 |
| 18.Портреты пользователей с адресными рекомендациями | 9 | 9 |
| Итого (средняя) | 8,2 | 6,2 |
Методика: каждая подтема оценивалась по шкале 1–10. Итоговая средняя — арифметическое всех подтем.
Финальный вердикт
Короткие итоги по каждому сервису — чтобы не перечитывать весь обзор.
DALL-E 3
Берите DALL-E 3, если вам важно prompt-adherence (5+ элементов в кадре через GPT-4), conversational refinement в одном чате с ChatGPT, или просто нет времени учить экосистему ComfyUI/A1111. Лучшее понимание сложных промптов в категории. C2PA watermarking встроен, commercial license во всех тарифах. ⚠ Сервис уходит 12.05.2026 → миграция на GPT Image 1.5 (заявлен тот же tier-доступ, тот же commercial license). Доступ через ChatGPT Plus $20/мес — если подписка уже есть, DALL-E 3 идёт «в довесок». Минусы: API в 10× дороже SD (~$0.04 vs $0.004), ControlNet и LoRA нет, self-host невозможен (152-ФЗ невозможно), РФ-доступ требует VPN + зарубежной карты, нет prompt-комьюнити.
Попробовать DALL-E 3
Stable Diffusion
Берите Stable Diffusion, если вам нужны: ControlNet (точная композиция через OpenPose / depth / contour), LoRA (брендовый стиль через 30–90 минут тренировки), production-API в 10× дешевле DALL-E (Stability ~$0.004/картинка для SDXL), self-host для регуляторики (152-ФЗ / медицина / air-gapped) или большие объёмы (10 000+ картинок/мес — окупает RTX 4090 за 1–3 месяца). Open-weights с лицензией (CreativeML Open RAIL-M для SDXL без revenue limits, Community License для SD3/3.5 до $1M annual revenue). Минусы: prompt-adherence хуже DALL-E на сложных промптах (нужны weights/ControlNet для приближения), DevOps-сложность (ComfyUI / A1111), Stability AI в кризисе после ухода Mostaque 03/2024, иск Getty с 2023. Для российского пользователя — лучший выбор: self-host не зависит от блокировок и оплат.
Попробовать Stable Diffusion