Главное за 30 секунд
YouTube в мае 2026 ужесточил правила «inauthentic content» — каналы на шаблонных пресетных стилях теряют монетизацию первыми. TikTok прячет такие ролики в «Not interested» ещё до публикации. Решение, которое к июню 2026 закрепилось у выживших AI-каналов: одна авторская картинка-референс на серию, к которой по i2i прицепляются все остальные кадры.
Это не теория. Welder 13 июня 2026 выкатил per-series custom style (100% image-to-image) — пользовательский слой поверх voiceover-движка v3 Creative-Max. Sora 2 умеет «Reference to Video» с осени 2025, Veo 3.1 поддерживает до 3 reference images, Runway Gen-4.5 завёл cross-scene consistency через первый кадр. Kling 3 закрыл style transfer на верхних тарифах.
Дальше — практический пайплайн: где взять источник, чем отличается i2i от style-tokens, и таблица того, что реально работает в каждой модели на середину июня 2026.
Почему пресетные стили сдают позиции в 2026
Пресет — это короткое имя в раскладке вроде cinematic, anime, vhs, webtoon. Модель прогоняет его через свой латент: 99% таких роликов выходят с одной и той же текстурой кожи, одним фокусом, одним светом. Алгоритм YouTube даже на уровне промпт-фильтра научился их клеймить — см. внутренний разбор AI-Slop 2026.
Конкретно что ломается на пресетах:
- CTR обложек ниже 4%. Пресет «лиминальные пространства» в начале мая давал 8.2% CTR, к 12 июня — 3.6% (срез на 47 каналов в воркспейсе Welder voiceover).
- Retention падает после 3-й секунды на 18-22 п.п. Зритель видел такой кадр раньше у других каналов и свайпает.
- Партнёрские интеграции отказывают. Бренды просят «уникальный визуал» — пресет таких гарантий не даёт.
Кастомный референс работает иначе: вы один раз делаете базу — основную картинку одного автора, художника или модели — и ВСЕ кадры серии вырастают оттуда через i2i. Стилистическое ДНК остаётся стабильным, но каждый отдельный кадр уникальный.
Кастомный референс — это не «загрузил и работает»
Половина каналов, которые «попробовали кастом» в мае, откатились обратно на пресеты в течение недели. Причина одна: спутали два разных механизма.
Style tokens — текстовое описание стиля прямо в промпте: «in the style of Studio Ghibli, cel-shaded, soft pastel palette». Это даёт модели семантическую подсказку, но не визуальный anchor. Кадр будет «похож» — но плыть.
Image-to-image (i2i) reference — реальная картинка-источник, которую модель использует как латентный якорь для каждого нового кадра. Кадр получается заметно ближе к источнику по цвету, композиции, текстуре. Sora 2 называет это «Reference to Video», Veo 3.1 — «reference images» (до трёх), Runway Gen-4.5 — «Image References», Kling 3 — «Style Transfer».
Разница на практике:
| Способ | Стабильность стиля | Гибкость промпта | Когда брать |
|---|---|---|---|
| Style tokens в тексте | 30-50% | высокая | для пробников и тестов |
| i2i reference image | 75-90% | средняя | для прод-серии 20-30 эпизодов |
| Полный fine-tune (LoRA) | 95%+ | низкая | для собственного IP или продукта |
Эта статья — про средний путь: i2i reference на одной авторской картинке, без обучения LoRA и без долгих промпт-итераций.
Где взять единую исходную картинку
Чтобы i2i заработал, нужен качественный источник от 1024×1024 пикселей с чёткой стилистической подписью. Четыре пути:
1. Midjourney v7 (~$10/мес). Самый частый выбор у RU-креаторов. Композиция, освещение, текстуры — на уровне арт-дирекшна. Минус — нужны VPN и иностранная карта, ~₽5–8 за изображение в пересчёте.
2. Gemini 2.5 Flash Image (~$0.039 за изображение через API, бесплатно в Google AI Studio). Удивительно сильна для референсов под Veo 3.1 — собственная модель Google «понимает» свои же модели генерации видео. Доступна из РФ через AI Studio при логине через VPN.
3. FLUX.1.1 Pro (через Together AI или Replicate, ~$0.04 за изображение). Лучше всех держит текстуры — волосы, кожу, материалы — идеально для photorealistic-каналов. Минус — слабее в композиции, требует чётких prompt-инструкций по кадрированию.
4. Своя ручная иллюстрация. Самый сильный moat: рисует автор-художник (₽3–15К за арт), референс становится частью бренда. Подходит каналам в нишах аниме, comic, webtoon, papercraft — где модель плохо угадывает «авторский почерк».
Для большинства AI-каналов в RU достаточно Midjourney + ручная пост-обработка в Photoshop 10-15 минут: убрать водяные знаки, выровнять центральную композицию, поднять контраст в средних тонах.
Платформы 2026: что умеет каждая
Срез на 14 июня 2026:
| Платформа | Reference image | Длина клипа | Цена за 8 сек 1080p | Доступ из РФ |
|---|---|---|---|---|
| Welder voiceover (движок v3) | 1 ref на серию (100% i2i) | до 60 сек серия из 8-12 cuts | от ₽100 за публикацию | напрямую, без VPN |
| Sora 2 (OpenAI) | 1 ref + Cameos | до 25 сек | ~$0.50 в ChatGPT Pro ($200/мес) | VPN + иностранная карта |
| Veo 3.1 (Vertex AI) | до 3 ref + multi-prompt | до 60 сек multi-prompt | $0.40–0.60 с аудио | Google AI Studio + VPN |
| Runway Gen-4.5 | до 3 ref + first-frame anchor | до 60 сек | ~$0.80 (Standard $35/мес) | напрямую через карту мир |
| Kling 3 (Kuaishou) | Style transfer на Pro+ | 5–10 сек | ~$0.40 (тариф $35/мес) | напрямую, без VPN |
| Midjourney Video v1 | Style + character ref | 4 сек | ~$0.30 (Standard $30/мес) | VPN + иностранная карта |
Секунда 1080p у всех стоит примерно одинаково, но workflow вокруг референса сильно отличается. Sora 2 ждёт один анкор-кадр + текст для остального; Veo 3.1 даёт три слота под персонажа + сцену + предмет одновременно; Welder привязывает референс к ВСЕЙ серии через настройку reference_image_url и применяет его на этапе генерации каждой сцены — без необходимости вручную грузить картинку в каждый кадр.
Welder проигрывает Sora 2 в максимальной длительности отдельного клипа (60 vs 25 сек, но Sora лучше держит сложную физику в коротких клипах) и проигрывает Veo 3.1 в количестве одновременных reference-слотов. Зато выигрывает в стоимости серии и в инфраструктуре: один полный voiceover-ролик на 45–60 секунд через i2i движок v3 — от ₽100 за публикацию, без VPN и без иностранной карты.
Экономика серий и удержание персонажа на длинной дистанции — отдельный сюжет, разобран в гайде «Сохранить героя AI-Shorts 2026»: там по реальным кейсам прикинули, сколько стоит держать одного героя через 30 эпизодов.
Пайплайн: одна картинка → серия из 30 Shorts
Реальный workflow, который собрали 4 канала на Welder между 1 и 14 июня:
Шаг 1. Концепт — 20 минут. На одном A4 рисуете moodboard серии: жанр, эмоция, главный персонаж, локация, палитра из 3–5 цветов. Можно прямо в Figma или Miro.
Шаг 2. Source frame — 1–2 часа. В Midjourney (или FLUX, или вручную) генерируете 30–40 кандидатов на единый источник. Выбираете ТРИ — основной + два бэкапа. Главные критерии: чёткая центральная композиция, узнаваемая палитра из 3–5 цветов, выраженный свет (контровой, боковой или верхний).
Шаг 3. Загрузка референса в Welder — 30 секунд. На странице серии (Настройки → Визуальный стиль → Кастомный референс) грузите выбранную картинку. С 13 июня 2026 это пер-серийная настройка — каждая серия канала может иметь свой моат, в одном аккаунте можно вести три-четыре непересекающихся визуальных мира.
Шаг 4. Тест-пилот: 3 ролика — 1 день. Запускаете три эпизода-пробника на разных сюжетах внутри одной ниши. Смотрите, держится ли визуал на разных типах сцен (день/ночь, интерьер/экстерьер, статика/движение). Если плывёт — меняете на бэкап-референс из шага 2.
Шаг 5. Прод-режим: 27 роликов автопостинга — 3–7 дней. В Welder ставите автопостинг с расписанием (2–3 публикации в день на канал) и пишете 27 заголовков-идей по принципу «знакомый сюжет в кастомном визуале». Все 27 эпизодов унаследуют тот же визуальный якорь без вашего участия.
Результат на 14 июня по 4 каналам, которые прошли этот пайплайн:
- Средний CTR обложки вырос с 4.1% до 6.8% за первые 7 дней относительно их же предыдущей серии на пресете.
- Retention на 5-й секунде поднялся на 11–14 п.п. — зритель не свайпает в первые 2 секунды, потому что не видел такой кадр раньше.
- Один канал (ниша «архитектура XX века») получил публикацию в подборке «Originals» от YouTube Shorts на 9-й день — алгоритм сам отметил уникальный визуал.
Это не магия — это просто отсутствие копии. Алгоритм 2026 ищет «information gain», и уникальный визуал — самый дешёвый способ его дать.
Анти-паттерны: чего не делать с референсом
- Не грузите кадр из чужого канала. Алгоритмы научились находить визуальные дубли, особенно жёстко на TikTok. Под бан попадаете и вы, и оригинал.
- Не используйте кадр со знаменитостями. OpenAI в феврале 2026 закрыл uploads с лицами для Sora 2; Veo 3.1 это всегда запрещало. Кастомный референс с лицом реального человека = блок в 90% случаев.
- Не меняйте референс посреди серии. Идея «обновим визуал на 15-м эпизоде» рушит retention возвращающихся подписчиков. Если совсем нужно — закрывайте текущую серию, открывайте новую как отдельный плейлист.
- Не пытайтесь обмануть i2i Welder, подгружая ASCII-арт или скриншот UI. Движок распознаёт их как low-signal source и автоматически откатывается на дефолтный пресет ниши — деньги списываются, мат не работает.
- Не масштабируйте без теста. Если канал-пробник на референсе X дал хорошие цифры — это НЕ значит, что тот же референс отработает на другой нише. Каждую серию тестируйте на 3 эпизодах перед автопостингом.
Запуск кастом-стиля у себя на этой неделе
К середине июня 2026 пресеты ушли в категорию «как у всех». Если AI-канал делает деньги — он делает их на чём-то, что нельзя скопировать за 5 минут. Кастомный i2i референс — самый дешёвый способ moat без LoRA-обучения и без художника в штате.
Чек-лист на эту неделю:
- Выберите одну серию из текущих, у которой за последние 14 дней просел CTR обложки.
- Сгенерируйте 30 кандидатов на референс в Midjourney v7 или Gemini 2.5 Flash Image.
- Загрузите выбранный кадр в
Настройки серии → Визуальный стиль → Кастомный референсв Welder. - Запустите 3 тест-эпизода, сверьте CTR и retention с предыдущими.
- Если цифры выше — ставьте автопостинг на 27 эпизодов и берёте следующую серию.
Открыть дашборд Welder и привязать референс — серия с кастомным стилем настраивается за 30 секунд, первый тестовый ролик уходит в рендер сразу после.