Главное про видео-генераторы в 2026 году: они уже умеют красивую картинку, но плохо умеют физику и сложные камерные движения. Реклама на 15 секунд через Sora — пожалуйста, трёхминутная сцена с диалогом и эмоциями — пока нет. Промпт ниже не сделает чудо, но снимет рутину: структуру, описание камеры, лайтинг, мудборд.
Внутри — 8 шаблонов под разные форматы: рекламный ролик 15–30 сек, динамичный Reel под музыку, B-roll для подложки, видео с аватаром (HeyGen / Synthesia), motion-логотип. Промпты на английском — все видео-модели лучше понимают английский, русские пояснения вокруг.
Один технический совет: длинные подробные промпты на видео работают **хуже** коротких. Sora и Runway теряют фокус на 5+ строках инструкций. Идеальная длина — 3–5 строк плотных деталей: субъект, действие, камера, свет, стиль. Всё лишнее модель проигнорирует или возьмёт случайный акцент.
🎬 Рекламный ролик 15–30 секунд
Cinematic 15-second commercial for [PRODUCT_NAME], [PRODUCT_CATEGORY — fitness app / fintech / coffee brand]. Scene: [LOCATION + TIME OF DAY — modern office at sunset / cozy kitchen morning / urban street at night]. Subject: [WHO IS IN FRAME — young professional woman, couple, athlete, etc.] interacting with the product naturally, no direct address to camera. Camera: smooth dolly-in from wide to medium shot, shallow depth of field, 35mm lens look. Lighting: soft natural light with [WARM / COOL / NEON] accent. Mood: [confident / calm / energetic — pick one], style reference: [AGENCY OR DIRECTOR NAME — Apple commercial / Wes Anderson / Netflix doc]. Text overlay: none in this version (added in post).
Запрет «no direct address to camera» снимает типичную ошибку видео-моделей: персонаж смотрит в кадр и говорит, губы не синхронны со словами (потому что слов нет), результат уровня дешёвой стоковой рекламы. Постпродукция с текстом и музыкой — потом, в After Effects.
📱 Reel под трендовую музыку
Vertical 9:16 video for Instagram Reels / TikTok, duration 8 seconds. Subject: [WHAT — close-up of hands creating something, transformation reveal, before/after, day in the life shot]. Action: [SPECIFIC MOTION — hands kneading dough, paint stroke across canvas, jump-cut outfit changes]. Camera: dynamic — quick zoom-in or whip-pan, handheld feel. Aesthetic: [colorful / muted / pastel / dark moody — pick one], matches the music vibe of [TRACK_GENRE]. Lighting: high contrast, slightly overexposed highlights for that scroll-stopping pop. First frame must be visually arresting (the hook for TikTok algorithm).
9:16 формат и упор на «first frame must be arresting» — критично, потому что TikTok/Reels алгоритмы решают судьбу видео по первым 0.5 сек. Если кадр-1 невнятный, удержание <10%, и видео в выдаче не попадает. Подгонка эстетики под жанр музыки (которую вы потом наложите) — против рассогласования картинки и звука.
🎞️ B-roll для подложки
Generate 5-second cinematic b-roll footage to underscore a [TOPIC — productivity / nature / urban life / coding] segment. No people in frame. Pure environment / objects / textures. Suggested shots: 1) Slow push-in on [SPECIFIC OBJECT — laptop, plant, coffee, book, gear]. 2) Time-lapse-style movement (clouds, traffic, people from above). 3) Macro / extreme close-up on detail. Camera: stable, slow, deliberate. Color: [warm orange-teal / cold cyan / monochrome] — should not compete with main footage on top. Mood: subdued, supportive, leaves headroom for voiceover.
B-roll по определению — подложка под закадровый текст, поэтому требование «не конкурировать с main footage» и «сдержанная палитра» критичны. Яркая хаотичная картинка перетягивает внимание и убивает посыл голосового нарратива.
🎙️ Аватар-видео (HeyGen / Synthesia)
Промпт-инструкция для HeyGen или Synthesia (скрипт + настройки): Аватар: [Avatar name — выбрать готового / загрузить своего]. Язык: русский. Голос: [мужской / женский, нейтральный / тёплый / энергичный]. Сценарий (в 100–150 слов): [ПЕРВАЯ_ФРАЗА — крючок без «Здравствуйте, я хочу рассказать»]. [ОСНОВНАЯ_МЫСЛЬ — одна, не три]. [1–2 КОНКРЕТНЫХ ПРИМЕРА]. [CTA — что зритель должен сделать]. Темп речи: средний (около 150 слов в минуту). Паузы: после первой фразы и перед CTA — обозначь троеточием. Жесты: [естественные / минималистичные]. Фон: [офис / однотонный / corporate background — выбрать из библиотеки HeyGen].
Аватар-видео из HeyGen и Synthesia в 2026 году узнаваемы за 2 секунды (артикуляция, мимика, лёгкая «стеклянность» глаз). Это нормально для внутренних обучающих видео или multilingual landing page, но плохо для customer-facing рекламы. Скрипт без «Здравствуйте» снижает узнаваемость на 30–40%.
✨ Motion-логотип (intro / outro)
3-second logo reveal animation for brand [BRAND_NAME]. Style: [minimalist / glitch-tech / luxurious gold / playful pop — pick one]. Concept: 0–1 sec: clean background, build-up tension. 1–2 sec: logo elements assemble from particles / strokes / shapes. 2–3 sec: final logo settles, subtle pulse or glow. Background: [BRAND_PRIMARY_COLOR or gradient]. Sound design hint: punchy whoosh + soft impact at 1.8 sec, sustained reverb tail (designed in post). No text other than the brand name appearing.
Видео-моделям motion-графика даётся хуже, чем кинематографические сцены. Лучше использовать промпт как starting point и доводить в After Effects. Альтернатива — дешёвые motion-templates на Envato. Но если бюджет 0, Sora/Runway даст кадр, который заменит безымянный stock-intro.
🌍 Тревел-кадр / lifestyle
Cinematic travel shot, 8 seconds, golden hour. Location: [SPECIFIC PLACE — Bali rice terraces / Tokyo neon street / Sahara dunes / mountain village]. Foreground: [SUBJECT — silhouette of person from behind, flag, lantern, vehicle]. Camera: aerial drone arc OR slow handheld follow OR static wide. Lighting: warm low-angle sun, long shadows, lens flare. Style reference: [PHOTOGRAPHER — Peter McKinnon / Nainoa Langer / The North Face campaign]. No motion blur on main subject.
Конкретный референс фотографа или кампании поднимает качество в 2–3 раза. Без него модель скатывается к обобщённому «красиво», что узнаётся как stock. Запрет на motion blur нужен потому что Sora и Runway по умолчанию добавляют artistic blur, который ломает чёткий силуэт subject'а.
🍽️ Food-видео для соцсетей
Vertical 9:16 food video, 6 seconds. Subject: [DISH — close-up of pasta being twirled / syrup pouring on pancakes / steam rising from coffee]. Camera: macro lens, shallow depth, slight rotation or smooth dolly. Lighting: warm overhead with bounce, no harsh shadows. Surface: [marble / wooden cutting board / linen napkin]. Action: hands enter from frame edge to interact (pour, garnish, pick up) — show natural human touch, fingers with normal anatomy. Color palette: appetizing — warm yellows, deep reds, cream whites. No blue or green tints. First frame: dish already plated, beautiful.
Главная боль food-видео из ИИ — руки. Видео-модели часто генерируют 6 пальцев или странные суставы, и в food-контенте это сразу заметно. Просьба «normal anatomy» в промпте помогает только частично, поэтому генерируйте несколько вариантов и выбирайте тот, где руки в норме. Запрет на синий/зелёный — потому что они подсознательно сигналят «несвежее».
🎨 Стилизованная анимация (2D / 3D mix)
Stylized animated short, 6 seconds, 16:9. Style: [hand-drawn 2D / Pixar 3D / anime / claymation / cyberpunk neon]. Subject: [CHARACTER — short character description: age, appearance, mood], doing [SPECIFIC ACTION]. Background: [SETTING — describe in 1 phrase]. Color palette: limited to 4–6 colors maximum, dominant [COLOR_NAME]. Camera: static medium shot OR slow push-in. Animation feel: [smooth and fluid / choppy stop-motion / limited frames anime] — pick one explicitly. No text, no captions, no logos in frame.
Ограничение «4–6 colors maximum» — против тенденции моделей генерировать перегруженные палитры в стилизованной анимации. Чем меньше цветов, тем более единым выглядит стиль. Явное указание типа анимации (smooth vs choppy) тоже критично — модель не угадывает по жанру и часто путает пиксар-плавность с аниме-каркасом.