Главное за 30 секунд
Первые 3 секунды решают больше 70% удержания на TikTok и Reels. YouTube подтвердил это новой формулой: «свайп-или-остаюсь» оценивается за первые 3 секунды, и порог для алгоритмического разгона — 75–80% Average Percentage Viewed на отметке 0:03. На TikTok среднее время просмотра в 2026 — 8.4 секунды, а ролики 21–34 секунды держат рекорд по completion rate (62%). YouTube Shorts ждёт ≥70% APV до конца, иначе не показывает новой аудитории.
Под эту формулу есть три бюджета клипа: Veo 3.1 даёт 4/6/8 секунд за генерацию (с extend до 148 секунд), Sora 2 Pro — до 25 секунд за раз, Kling 3.0 — до 15 секунд с шестью встроенными шотами. Welder поверх Veo 3.1 склеивает 5–10 таких клипов в 35–45-секундный ролик с RU-озвучкой ElevenLabs v3 и кадровой сменой каждые 3–4 секунды. Ниже — поминутный разбор того, ЧТО должно происходить в каждом окне таймкода и почему именно AI-Shorts ломаются на 6-й и 18-й секунде.
Бенчмарк ретеншена 2026: что считать «хорошим»
Алгоритм TikTok и YouTube смотрит на retention не как на одно число — он смотрит на КРИВУЮ. Хороший AI-Short в 2026 выглядит так:
| Таймкод | TikTok bench | Shorts bench | Что должно произойти |
|---|---|---|---|
| 0–3 сек | ≥70% | ≥80% | Свайп-или-остаюсь, хук |
| 3–10 сек | ≥55% | ≥70% | Экспозиция, постановка проблемы |
| 10–20 сек | ≥45% | ≥65% | Поворот, новая информация |
| 20–35 сек | ≥40% | ≥60% | Пик, конкретика, цифра |
| 35–45 сек | ≥35% | ≥55% | Финал + крючок на rewatch |
| Конец | 40–50% APV | ≥70% APV | Вирус ИЛИ flop |
Источник: бенчмарки TikTok Creator Portal на 2026 и агрегации Socialync. «Healthy» APV для Shorts в 2026 — 70% и выше, на нём срабатывает алгоритмический буст. APV выше 100% — вирусная зона: аудитория пересматривает ролик целиком.
Для AI-каналов кривая дополнительно проседает на стыках клипов — человеческий глаз ловит «другую руку», «другую погоду», «другую длину волос». Чем меньше клипов в ролике, тем легче гладкая кривая. Чем чаще smooth-cuts на «продолжении движения», тем меньше виден стык.
Если вы только начинаете и не уверены, какой длиной целиться, проверьте гайд по бюджету AI-канала 2026 — там стек под ₽30K/100K/300K в месяц и привязка к ожидаемой кривой APV.
Бюджет ролика по моделям: сколько секунд даёт каждая
Прежде чем верстать таймкоды, посчитайте, ЧЕМ вы будете заполнять ленту времени. Цифры — на июнь 2026.
| Модель | Макс. длина клипа | «Безболевый» сегмент | Релиз |
|---|---|---|---|
| Veo 3.1 | 8 сек (extend до 148 сек) | 6–8 сек | 17.11.2025 |
| Sora 2 (Plus) | 5–15 сек | 10–12 сек | 30.09.2025 |
| Sora 2 Pro | до 25 сек | 15–18 сек | 30.09.2025 |
| Kling 3.0 | 15 сек (6 шотов внутри) | 12–15 сек | 04.02.2026 |
| Runway Gen-4 | 10 сек | 8–10 сек | 2025 |
| Welder (поверх Veo 3.1) | 35–60 сек собранного | 5–10 клипов по 6–8 сек | 2026 |
Sora 2 Pro закрывает целый 15-секундный сегмент одним клипом — это редкое преимущество для непрерывных хуков длиной до 18 секунд. Зато Sora 2 не умеет ставить русский lip-sync, а Veo 3.1 в комбинации с ElevenLabs v3 — умеет. Kling 3.0 — единственная модель, у которой в одной генерации сразу шесть SHOT-ов с native audio (японский, корейский, испанский), но русского голоса в audio-стеке нет. Поэтому в RU-Shorts реалистичный пайплайн в 2026 — это либо Welder поверх Veo 3.1 (RU-озвучка из коробки), либо ручная сборка из Sora 2 Pro с пост-озвучкой в ElevenLabs.
0–3 секунды: «свайп-или-остаюсь»
В первых 3 секундах нужно ровно одно: вызвать когнитивный долг, который зритель захочет закрыть. Не «привет, ребята, сегодня поговорим про…» — а ВОПРОС, КОНТРИНТУИЦИЯ или КОНТРАСТНЫЙ КАДР.
Технические требования к этому окну для AI-Shorts:
- Один клип, не два. Стык в первые 3 секунды режет retention на 8–12 п.п. Если работаете на Veo 3.1 — берите один 4-секундный клип под хук. На Sora 2 Pro — один 5–6-секундный.
- Звук с первого фрейма. Тишина 0.3 секунды на старте даёт «свайп»: пользователь думает, что звук ещё не загрузился. Озвучка ElevenLabs v3 + ambient — обязательно.
- Текстовый хук с 0:00. Submagic, CapCut, Captions — любой бернёт хук поверх кадра. Хук-текст должен помещаться в 4–6 слов и читаться за 0.8 секунды.
- Динамика, не статика. Если первый кадр — стенд-апер на сером фоне, половина аудитории уже свайпнула. AI-кадр с движением (zoom, panning, action) даёт ту самую «зацепку».
11 готовых шаблонов хука — в отдельном разборе: хук первой секунды AI-Shorts 2026 под Veo 3.1. Там для каждого шаблона указан конкретный промпт-каркас.
3–15 секунды: фаза экспозиции и первый стык
В этом окне зритель решает, ОТКРЫТЬ ли он любопытство, которое вы посадили на 0:01. Здесь идёт первый монтажный стык, и для AI-Shorts он критичен.
Стык №1 ставьте на 3.5–4.5 секунде, не раньше. Почему: первая когнитивная нагрузка от хука переваривается ~2.5–3 секунды, и резкая смена кадра в это окно сбрасывает контекст. Хороший паттерн — закончить хук-клип на словах «…потому что» или «…а ещё» и продолжить во втором клипе.
Тип стыка:
- Match cut (продолжение жеста или предмета из кадра 1 в кадр 2) — золотой стандарт для AI-Shorts. Veo 3.1 умеет это через image-to-video с финальным кадром предыдущего клипа.
- J-cut/L-cut (звук опережает или продолжает кадр) — даёт сшитость без визуальной похожести кадров. Welder реализует это автоматически при сборке.
- Hard cut на бите озвучки — терпимо, если ElevenLabs-голос держит интонацию через стык.
Длина второго клипа: 6–8 секунд (Veo 3.1) или 10 секунд (Sora 2). В нём — конкретика, цифра, имя. Например, после хука «90% AI-каналов умирают на третьем месяце» во втором клипе — «и вот ровно одна причина» с визуализацией причины.
К 0:10 у зрителя должно быть прочитано 3 факта, а не «введение в тему». Если в этом окне идёт «…and that's why I want to tell you…», retention падает на 15–20 п.п.
15–30 секунд: пик и поворот
Это самая прибыльная зона ролика. Здесь алгоритм проверяет, есть ли смысл «доводить» зрителя до конца. Каждая лишняя секунда монотонности тут стоит 2–3 п.п. APV.
Что должно произойти:
- Смена ритма на 0:15. Если до этого было 2 клипа по 6 секунд (медленные), на 0:15 — короткий клип 3–4 секунды с резким движением или сменой локации.
- Поворот. «Но есть деталь, о которой не говорят». Контр-интуиция. Новая информация, которая делает предыдущие 15 секунд осмысленными.
- Цифра, имя, факт. Конкретика, которую можно процитировать в комментарии. Например, «Кейс канала о биохакинге: 168K подписчиков за 60 дней, ₽540K MRR» — такое пересылают.
- Стык №2 и №3. К 0:30 в ролике должно быть 4–5 склеек. На Veo 3.1 это 4–5 клипов, на Sora 2 Pro — 2 клипа.
Тут же ставится «крючок на финал»: «а вот что делать дальше — через 10 секунд». Это поднимает retention к 0:35 на 8–12 п.п.
Если ваш пайплайн на Welder, кадровая смена каждые 3–4 секунды — стандарт по умолчанию в 5-слойной формуле промпта Veo 3.1. Можно вручную поднять плотность для зон поворота.
30–45 секунд: финал и крючок на rewatch
Последние 10–15 секунд решают, будет ли ролик вирусным или средним. Здесь два узла.
Узел 1 — финальная конкретика (30–40 сек). «Что делать?» Один абзац с инструкцией, цифрой, рекомендацией. Не размытое «думайте сами», а «вот три шага». Если у вас гайд — короткое резюме. Если кейс — выводы из него.
Узел 2 — loop (40–45 сек). Концовка должна ОТСЫЛАТЬ к началу. Loop-замыкание поднимает APV на 18–25 п.п. и провоцирует replay. Девять конкретных техник (визуальное эхо, незакрытое утверждение, перевёрнутая формулировка хука) разобраны в гайде по loop-концовке AI-Shorts.
Антипример: «Подписывайтесь, ставьте лайки, пока». Это убивает APV на 15–20 п.п., потому что зритель в этот момент свайпает.
Сборка склеек: где AI-клипы выгодны, а где ломаются
AI-Shorts отличаются от человеческих тем, что у вас нет «одного длинного дубля» — вы всегда работаете с пачкой 6–10-секундных клипов. Это даёт три выигрыша и два болевых места.
Выигрыши:
- Стык 6/4 секунды можно подстроить ПОД бит озвучки идеально, без post-production. Welder при сборке умеет shift-ить стык до ±0.3 секунды.
- Можно тестировать варианты хука без перерисовки остального ролика. Меняете только первый клип Veo 3.1.
- Композитная сборка ffmpeg даёт честные subtitle timings без рассинхрона, в отличие от рендера в CapCut.
Болевые места:
- Drift персонажа. Если ваш сценарий ведёт один герой, на 4–5-м клипе у Veo 3.1 он может «сместиться»: другая причёска, другая одежда. Решение — image-ref на финальный кадр предыдущего клипа.
- Drift освещения. Veo 3.1 и Sora 2 склонны менять «время суток» между генерациями. Закладывайте в промпт LIGHTING: hard, golden hour, overhead — одинаковый для всех клипов серии.
Подробный гайд по стилю AI-Shorts на Veo 3.1 и Sora 2 разбирает 7 направлений визуала и для каждого даёт LIGHTING-пресет.
Welder, Sora 2, Veo 3.1, Kling 3: кто что закрывает
Сводная таблица того, какая модель тянет какой кусок таймлайна без боли:
| Кусок таймлайна | Лучшее решение | Почему |
|---|---|---|
| 0–4 сек (хук) | Sora 2 Pro ИЛИ Veo 3.1 (4 сек) | Один клип без стыка — критично |
| 4–15 сек (экспозиция) | Veo 3.1 + ElevenLabs v3 | RU-голос, image-ref для match cut |
| 15–30 сек (поворот) | Veo 3.1 цепочкой 4+8 сек | Гибкость по ритму, низкая цена |
| 30–45 сек (финал) | Kling 3.0 6 шотов ИЛИ Veo 3.1 | Многошотовая сцена закрывает финал |
| Сборка + субтитры | Welder | Автостыковка, RU-озвучка, ffmpeg |
Welder остаётся единственным сервисом в 2026, который принимает текстовую нишу и отдаёт готовый 35–45-секундный RU-ролик: с озвучкой, сменой кадров каждые 3–4 секунды и выжженными субтитрами. Ручная сборка из Sora 2 Pro + ElevenLabs + CapCut даёт чуть выше качество отдельного кадра, но занимает 3–5 часов за ролик против ~12 минут у Welder. На канале с автопостингом 3 ролика/день разница превращается в 9 часов работы каждый день.
По чистому качеству КАДРА Sora 2 Pro в 2026 впереди — особенно на сложных промптах с физикой и людьми. Veo 3.1 лучше держит русский lip-sync. Kling 3.0 — самый дешёвый при 4K-выводе. Подробное сравнение по 12 промптам — в сравнении Veo 3.1, Sora 2, Kling 3 и Runway. Тарифы Welder под автопостинг — на /pricing.
Что делать прямо сейчас
- Откройте YouTube Studio и посмотрите кривую APV по последним 10 Shorts. Где провал — 0:03, 0:10 или 0:25?
- Если провал на 0:03 — переделывайте хук-клип. Один 4-секундный клип Veo 3.1 или Sora 2, с текстовым хуком и звуком с 0:00.
- Если провал на 0:10 — у вас плохой первый стык. Перепишите второй клип так, чтобы он начинался с конкретики или поворота.
- Если провал на 0:25 — добавьте «крючок на финал» к 0:18: «а вот что делать дальше — через 10 секунд».
- Если у вас вообще нет автоматизации — соберите следующий ролик через Welder с серией из 5 клипов по 6 секунд. Сравните APV с вашим ручным монтажом за неделю.
Кнопка действия — запустить серию на Welder. Пайплайн собран под таймкоды этой статьи: смена кадра каждые 3–4 секунды, RU-голос ElevenLabs v3 на финальном Veo 3.1, выжженные субтитры из коробки.