Обложки AI-Shorts 2026: Midjourney, Imagen 4, Flux, Ideogram

Тест на 24 промптах: какая модель ставит русский текст на обложку Shorts, не выглядит как AI и держит CTR в YouTube-поиске. С ценами и кейсом.

Главное за 30 секунд

В июне 2026 для обложки русскоязычного Short у вас 5 топовых моделей и одна неловкая правда: ни одна западная модель не понимает русскую кириллицу так же хорошо, как латиницу. Imagen 4 Ultra от Google рендерит русский текст с ~85% точностью по $0.06 за картинку. Ideogram 3 даёт 90–95% на латинице, но на кириллице падает до 60–70%. Midjourney v7 (с V8.1-апдейтом от 30 апреля 2026) даёт лучший кадр без текста — и пишет на нём в Canva. Flux Pro 1.1 Ultra — 4-мегапиксельный output за 10 секунд по $0.06. Recraft V3 — единственный, кто делает вектор и держит бренд через style reference.

В РФ без VPN сейчас работает Kandinsky 5.0 от Сбера и YandexART — но качество и понимание сложных промптов отстаёт от Imagen 4 примерно на одно поколение. Дальше — детальный тест на 24 промптах, ценник в год для 200 обложек в месяц, и как Welder AI делает обложку прямо из первого кадра видео.

Зачем обложка для Shorts, если все свайпают

Вертикальный feed YouTube Shorts, TikTok и Reels рендерит превью на лету: алгоритм подсовывает Short без клика, пользователь свайпает. CTR здесь не работает — замените его на swipe rate. По данным Miraflow за 2026 год, swipe rate ≤30% считается сильным результатом, а главный рычаг роста — первые 1–2 секунды самого ролика, не превью.

Но обложка всё ещё закрывает три критичных placement:

Канал и раздел Shorts. Пользователь зашёл в ваш профиль, видит 30 превью одновременно. Тут он кликает, не свайпает.
YouTube Search и Hashtag pages. Органический трафик из поиска работает по CTR, как в long-form. Хорошая обложка для Shorts в поиске даёт 5–12% CTR в зависимости от ниши.
Внешний шеринг. Когда видео уходит в Telegram, чат WhatsApp или Twitter, превью — единственное, что видит человек до клика.

Если у канала сейчас 50K просмотров в месяц на YouTube Shorts и 30% из них приходит из поиска (типичное распределение для AI-канала старше 60 дней), прокачка обложки с 5% до 9% CTR в поиске = +60% органического трафика без увеличения частоты выхода. Это прямой апсайд по RPM AI-Shorts в YT, TikTok, VK и Rutube — а значит, и по выручке канала.

Тест: 24 промпта × 5 моделей

Я прогнал одинаковый бриф на 5 моделях для 6 ниш AI-канала: автообзоры, городские легенды, научпоп, книжные пересказы, путешествия, faceless-история. По 4 варианта обложки в каждой нише. Один и тот же промпт-шаблон с подстановкой:

«Vertical 9:16 thumbnail for short video, "{ниша}". Bold large title "{RU-фраза, 2–4 слова}" in upper third, dark cinematic background, single human face partially in shadow, color accent yellow, no logos. Photo-realistic, 4K.»

Метрики оценки:

Текст — насколько чисто отрендерилась кириллица (1–10).
Композиция — читается ли превью на 80×142 px (размер в feed) (1–10).
AI-«пластмасса» — кадр выглядит как стоковая AI-картинка или как реальный photoshoot (1–10, чем выше — тем «реальнее»).
Скорость — секунд от запроса до готового файла.
Цена — за один полезный output (с учётом отбраковки: большинство моделей нужно прогонять 2–3 раза до годного).

Сравнительная таблица: цена, текст, скорость, доступ из РФ

Модель	$/img	RU-текст	Композиция	«Реальность»	Скорость	Доступ из РФ
Midjourney v7	~$0.08 (Standard $30/200)	4/10	9/10	8/10	30–60 сек	VPN + Discord
Imagen 4 Ultra	$0.06	8/10	8/10	6/10	8–12 сек	VPN или Gemini API
Flux Pro 1.1 Ultra	$0.06	5/10	8/10	7/10	~10 сек	API через fal/Replicate
Ideogram 3	$0.03–0.09	6/10 (RU), 9/10 (EN)	7/10	5/10	8–15 сек	VPN или API
Recraft V3	$0.04	7/10	7/10 (вектор)	4/10	6–10 сек	API
Kandinsky 5.0	бесплатно	6/10	6/10	6/10	15–30 сек	Прямой доступ
YandexART	бесплатно	6/10	5/10	6/10	10–20 сек	Прямой доступ

Главный инсайт: ни одна модель не даёт «всё сразу» — придётся комбинировать. Лучшая стратегия для русскоязычного канала на 2026 год — кадр в Midjourney или Flux, текст поверх в Canva, Figma или Recraft V3.

Midjourney v7: фотореализм без русского текста

Midjourney выпустила v7 в апреле 2025, а V8.1 — 30 апреля 2026. Это сейчас самый быстрый режим: стандартный job рендерится в 4–5 раз быстрее предыдущих версий. Ключевые фичи V7+: Omni Reference для консистентности персонажа между обложками сериала, Draft Mode для быстрых превью и измеримо улучшенный фотореализм — в тестах AVB модель победила V6 в 23 из 30 промптов (кожа, ткань, тени).

Цены 2026:

Basic — $10/мес, ~200 GPU-минут (~200 картинок).
Standard — $30/мес, ~900 картинок без unlimited-режима.
Pro — $60/мес, плюс Stealth-mode.
Mega — $120/мес, максимум throughput.

При годовой подписке скидка 20%: Basic $8, Standard $24, Pro $48, Mega $96.

Плюсы для обложек Shorts:

Лучший кадр среди всех — фотореализм, освещение, эмоция на лице героя.
Omni Reference закрывает боль сериального канала: один герой в 30 обложках выглядит одинаково.
V8.1 быстрее, значит, успеваешь итерировать больше вариантов за то же время.

Минусы:

Русский текст не пишет читаемо. На кириллице путает буквы, ставит лишние засечки, иногда генерирует псевдо-славянский «лорем ипсум».
Доступ только через Discord или web-UI midjourney.com, из РФ без VPN не работает.
Нет публичного API — для пайплайна агентства это блокер.

Вердикт: если у вас Welder AI или другой пайплайн без Midjourney в loop'е, используйте Midjourney руками для hero-кадра серии — раз в неделю, не на каждую обложку.

Imagen 4: лучший русский текст по $0.04

Google Imagen 4 стал генерально доступен в Gemini API в феврале 2026. Сейчас три тира:

Imagen 4 Fast — $0.02 за картинку, 4–6 секунд.
Imagen 4 Standard (Flagship) — $0.04, 8–12 секунд.
Imagen 4 Ultra — $0.06, 12–18 секунд, лучший detail.

Imagen 4 — единственная модель из топа, у которой русский текст рендерится без артефактов примерно в 85% случаев. В тестах на промптах вроде «обложка "ИИ-ВИДЕО ЗА 290₽"» Ultra-тир ставит и кириллицу, и символ ₽ читаемо. Standard уже фейлит ₽ в 30% случаев.

Плюсы:

Лучший RU-текст среди западных моделей. Не идеал, но прод-приемлемо.
Цена ниже Midjourney в перерасчёте на «годный» output.
API сразу с пайплайн-фрэндли SDK через Gemini.

Минусы:

Без VPN из РФ — никак: Google API заблокирован. Через прокси-сервисы дороже на 20–40%.
Лица иногда уходят в «пластмассу» с гладкой кожей — нужен Ultra-тир, не Fast.
Стиль более «корпоративный» — сложнее сделать треш-эстетику для городских легенд.

Вердикт: если канал уровня агентства с 4+ нишами и нужно делать 200+ обложек в месяц с русским текстом — Imagen 4 Standard ($8/мес за 200 шт) или Ultra ($12/мес за 200 шт) — самый чистый ROI.

Flux Pro 1.1 Ultra: 4 МП за 10 секунд

Black Forest Labs — стартап из бывших Stable Diffusion-инженеров — выпустил Flux 1.1 Pro Ultra в ноябре 2024, и в 2026 это всё ещё рабочая лошадка для пайплайнов. Цена через большинство API-провайдеров — ~$0.06 за картинку. Главный аргумент Flux — 4-мегапиксельный output (2048×3072 для 9:16) за 10 секунд. У Midjourney и Imagen базовое разрешение ниже, апскейл делается отдельным шагом.

Плюсы:

Скорость плюс разрешение. Ставим Welder и Flux в один пайплайн — рендер обложки занимает ровно 10 секунд после готового сценария.
API через fal.ai, Replicate, Together — выбор провайдеров и цен.
Лицензия позволяет коммерческое использование без доп. лицензирования.
Raw mode даёт фотореализм без «AI-glaze» — кадры выглядят как iPhone-фото.

Минусы:

Русский текст — 5/10. Лучше Midjourney, хуже Imagen 4.
Лица в массовых сценах теряют детали (но для одиночного героя — отлично).
На сложных композициях («герой смотрит в зеркало с отражением второго героя») путается чаще, чем Imagen 4.

Ideogram 3: 90% точность текста, но скучные кадры

Ideogram — стартап от ex-Google-Brain исследователей — единственный, кто строил модель вокруг текстового рендеринга с первого дня. Ideogram 3.0 заявляет 90–95% точность embedded-текста против 30–40% у Midjourney и Stable Diffusion. На латинице это правда. На кириллице падает до ~60–70% — лучше Midjourney, но хуже Imagen 4 Ultra.

Цены:

Free — 10 промптов в день.
Basic — $7/мес (400 промптов).
Plus — $15/мес (1000 промптов).
Pro — $42/мес (3000 промптов).
API — от $0.03 (TURBO) до $0.09 (QUALITY) за картинку.

В тесте на тех-канал с заголовком «AI TOOLS 2026» Ideogram дал layout, который читается на размере thumbnail. $30/мес = 1000 обложек, что для агентства с 6 каналами получается ~$5 за канал в месяц.

Плюсы:

Заголовок на латинице — лучший в классе. Логотипы, штампы, «BREAKING NEWS» — на пять.
Cheapest TURBO-режим — $0.03 за картинку, можно фигачить вариации.
Понимает «logo says X», «text reads Y» в промпте без хаков.

Минусы:

Кадры менее «киношные», чем у Midjourney или Flux — иногда выглядит как Canva-шаблон.
На кириллице сильно проседает.
Слабее в фотореализме лиц.

Recraft V3: вектор и бренд-консистентность

Recraft — единственная модель из топа, которая выдаёт вектор, а не растр. Это критично, если канал старше 6 месяцев и у вас сложился бренд: цветовая палитра, шрифты, формат логотипа. Recraft через Brand Style держит консистентность между десятками обложек.

Плюсы:

Вектор: масштабируется без потери, можно открыть в Figma или Illustrator и доработать.
Style reference — загружаете 5 ваших обложек, модель учится на них.
Лучший на сегодня для серий, где все обложки должны выглядеть как одна семья.

Минусы:

Не фотореализм — графика, иллюстрация, дизайнерская плоскость.
Если ниша требует «реальной» фотографии лица — не ваш выбор.
API дороже на сложных промптах из-за длительной генерации.

Когда брать: канал-сериал с устоявшимся визуальным стилем (см. Story bible AI-канала 2026), агентство с 4+ брендами под одним оператором.

Что есть в РФ без VPN: Kandinsky 5, Шедеврум

Для тех, кто не хочет жить с VPN, две RU-альтернативы:

Kandinsky 5.0 от Сбера — текущая версия на портале SberAI, выпущена после Kandinsky 4.1 (июнь 2025) с переходом на DiT-архитектуру (Diffusion Transformer). Скорость выросла в 4 раза против 3.1. Бесплатный доступ, RU-промпт без переводчика.

YandexART через сервис Шедеврум — в 2026 добавили выбор движка: YandexART или Janus Pro от DeepSeek. Тоже бесплатно, тоже понимает RU нативно.

Плюсы:

Прямой доступ, без VPN, без оплаты иностранной картой.
RU-промпт работает нативно, не нужно переводить.
Для прототипов и итераций — отличный бесплатный песочник.

Минусы:

Качество детализации на 1 поколение ниже Imagen 4 Ultra и Flux Pro.
Композиция с двумя людьми в кадре часто ломается (один герой — норм).
Лимиты: Kandinsky — лимит запросов в сутки, Шедеврум — лимит на user-аккаунт.
Текст: ~6/10 на кириллице, на латинице слабее Ideogram.

Реальный сценарий из РФ без VPN: для половины обложек использовать Kandinsky 5 (бесплатно, fastest path), а раз в неделю гнать «hero»-обложку через Flux Pro 1.1 (платим через fal.ai российской картой — провайдер принимает) или Imagen 4 (через прокси-сервисы вроде api.proxyapi.ru).

Workflow в Welder AI: обложка из первого кадра

Если канал делается через Welder AI, обложка генерится автоматически из первого кадра видео — это дефолт voiceover-режима (первый кадр истории доубл-юзится как social cover). Кадр уже спродюсирован с теми же параметрами стиля, что и весь Short. Не нужно отдельно платить за external image gen.

Но есть три ситуации, когда внешняя модель окупается:

A/B-тест обложки (как делать за 72 часа). Публикуем версию V1 с Welder-дефолтом, V2 — с обложкой Imagen 4 или Midjourney. Через 72 часа замеряем CTR в YT Search.
Постер серии. Главная карточка YouTube playlist'а или закреп в Telegram-канале, к которому ведёт серия. Тут нужно больше штучности, чем дефолтный first-frame.
Внешний шеринг. Превью в Telegram/Twitter обрезается до 1.91:1, не 9:16. Лучше отдельно генерим квадратный или горизонтальный вариант под этот placement.

Welder AI стоит от 290 ₽ за серию из 10 видео на старте, и в эту цену включена обложка из первого кадра. Imagen 4 Ultra поверх — ещё $0.06 × 10 ≈ ₽45 за серию. Если CTR растёт хотя бы на 20%, окупается с первой серии.

Композиция превью: правила, общие для всех 5 моделей

Какой бы моделью вы ни пользовались, на превью Shorts работает один и тот же набор правил:

Заголовок в верхней трети, не по центру и не снизу — нижняя треть закрывается UI плеера и комментариев.
Не более 3 слов в заголовке, 24–48 px эквивалент при размере превью 80×142 px.
Контраст лица и фона минимум 4.5:1 (WCAG AA) — иначе на пресете «тёмная тема» YT превью сольётся.
Жёлтый и оранжевый акцент работает лучше синего и зелёного — глаз цепляется в feed'е быстрее.
Одно лицо в кадре, не два и не группа. Свайп-поведение мозга — мгновенное распознавание ОДНОГО объекта.

Если делаете обложку под YouTube, помните про 9:16 safe-zone — даже на превью YT может обрезать верх или низ под UI.

Финал: какую модель брать под нишу

Ниша	Рекомендация	Бюджет в месяц
Faceless / научпоп / городские легенды	Welder default (first frame) + Imagen 4 Standard для постера серии	+$8 сверху
Автообзоры и тех	Midjourney v7 для hero + Ideogram 3 для текста поверх в Canva	$30
Книжные пересказы и литература	Recraft V3 (стилизация, шрифты, бренд-серия) + Imagen 4 Fast для альтернатив	~$15
Путешествия и lifestyle	Flux Pro 1.1 Ultra (фотореализм, raw mode) + текст в Figma	$0.06 × N
РФ без VPN	Kandinsky 5 для всего, Welder default — для финальных обложек	0 ₽

Тратить на обложку нужно ровно столько, сколько растит CTR на конкретной нише. Если ваш свайп-rate уже под 30%, идите оптимизировать хук первой секунды — там апсайд больше. Если в YouTube-поиске CTR ниже 4% — да, время вложиться в обложку, попробовать 3 разные модели и поднять до 7–9%.

Сделать первое видео с обложкой за вечер

Заведите канал, прогоните 10 Shorts через Welder AI — обложка будет автоматом из первого кадра. Через неделю, когда увидите, на каких роликах залип трафик из YouTube-поиска, прогоните для них Imagen 4 или Flux Pro как A/B-вариант. Сравните CTR. Это даст вам грубую оценку, какая модель работает лично в вашей нише, за 7 дней и $5.

Начать стоит с дефолтных обложек — открыть Welder AI и собрать первую серию.