Перейти к содержимомуАнатомия AI-Shorts 2026: таймкоды и retention 70%+
WWelder AI

Анатомия AI-Shorts 2026: таймкоды и retention 70%+

Гайды9 минWelder AI

Анатомия AI-Shorts 2026: таймкоды и retention 70%+

Поминутный разбор 35–45-секундного AI-ролика: где какие склейки, длина клипа Veo 3.1 и Sora 2 и в какой момент меняется ритм.

Главное за 30 секунд

Первые 3 секунды решают больше 70% удержания на TikTok и Reels. YouTube подтвердил это новой формулой: «свайп-или-остаюсь» оценивается за первые 3 секунды, и порог для алгоритмического разгона — 75–80% Average Percentage Viewed на отметке 0:03. На TikTok среднее время просмотра в 2026 — 8.4 секунды, а ролики 21–34 секунды держат рекорд по completion rate (62%). YouTube Shorts ждёт ≥70% APV до конца, иначе не показывает новой аудитории.

Под эту формулу есть три бюджета клипа: Veo 3.1 даёт 4/6/8 секунд за генерацию (с extend до 148 секунд), Sora 2 Pro — до 25 секунд за раз, Kling 3.0 — до 15 секунд с шестью встроенными шотами. Welder поверх Veo 3.1 склеивает 5–10 таких клипов в 35–45-секундный ролик с RU-озвучкой ElevenLabs v3 и кадровой сменой каждые 3–4 секунды. Ниже — поминутный разбор того, ЧТО должно происходить в каждом окне таймкода и почему именно AI-Shorts ломаются на 6-й и 18-й секунде.

Бенчмарк ретеншена 2026: что считать «хорошим»

Алгоритм TikTok и YouTube смотрит на retention не как на одно число — он смотрит на КРИВУЮ. Хороший AI-Short в 2026 выглядит так:

ТаймкодTikTok benchShorts benchЧто должно произойти
0–3 сек≥70%≥80%Свайп-или-остаюсь, хук
3–10 сек≥55%≥70%Экспозиция, постановка проблемы
10–20 сек≥45%≥65%Поворот, новая информация
20–35 сек≥40%≥60%Пик, конкретика, цифра
35–45 сек≥35%≥55%Финал + крючок на rewatch
Конец40–50% APV≥70% APVВирус ИЛИ flop

Источник: бенчмарки TikTok Creator Portal на 2026 и агрегации Socialync. «Healthy» APV для Shorts в 2026 — 70% и выше, на нём срабатывает алгоритмический буст. APV выше 100% — вирусная зона: аудитория пересматривает ролик целиком.

Для AI-каналов кривая дополнительно проседает на стыках клипов — человеческий глаз ловит «другую руку», «другую погоду», «другую длину волос». Чем меньше клипов в ролике, тем легче гладкая кривая. Чем чаще smooth-cuts на «продолжении движения», тем меньше виден стык.

Если вы только начинаете и не уверены, какой длиной целиться, проверьте гайд по бюджету AI-канала 2026 — там стек под ₽30K/100K/300K в месяц и привязка к ожидаемой кривой APV.

Бюджет ролика по моделям: сколько секунд даёт каждая

Прежде чем верстать таймкоды, посчитайте, ЧЕМ вы будете заполнять ленту времени. Цифры — на июнь 2026.

МодельМакс. длина клипа«Безболевый» сегментРелиз
Veo 3.18 сек (extend до 148 сек)6–8 сек17.11.2025
Sora 2 (Plus)5–15 сек10–12 сек30.09.2025
Sora 2 Proдо 25 сек15–18 сек30.09.2025
Kling 3.015 сек (6 шотов внутри)12–15 сек04.02.2026
Runway Gen-410 сек8–10 сек2025
Welder (поверх Veo 3.1)35–60 сек собранного5–10 клипов по 6–8 сек2026

Sora 2 Pro закрывает целый 15-секундный сегмент одним клипом — это редкое преимущество для непрерывных хуков длиной до 18 секунд. Зато Sora 2 не умеет ставить русский lip-sync, а Veo 3.1 в комбинации с ElevenLabs v3 — умеет. Kling 3.0 — единственная модель, у которой в одной генерации сразу шесть SHOT-ов с native audio (японский, корейский, испанский), но русского голоса в audio-стеке нет. Поэтому в RU-Shorts реалистичный пайплайн в 2026 — это либо Welder поверх Veo 3.1 (RU-озвучка из коробки), либо ручная сборка из Sora 2 Pro с пост-озвучкой в ElevenLabs.

0–3 секунды: «свайп-или-остаюсь»

В первых 3 секундах нужно ровно одно: вызвать когнитивный долг, который зритель захочет закрыть. Не «привет, ребята, сегодня поговорим про…» — а ВОПРОС, КОНТРИНТУИЦИЯ или КОНТРАСТНЫЙ КАДР.

Технические требования к этому окну для AI-Shorts:

  • Один клип, не два. Стык в первые 3 секунды режет retention на 8–12 п.п. Если работаете на Veo 3.1 — берите один 4-секундный клип под хук. На Sora 2 Pro — один 5–6-секундный.
  • Звук с первого фрейма. Тишина 0.3 секунды на старте даёт «свайп»: пользователь думает, что звук ещё не загрузился. Озвучка ElevenLabs v3 + ambient — обязательно.
  • Текстовый хук с 0:00. Submagic, CapCut, Captions — любой бернёт хук поверх кадра. Хук-текст должен помещаться в 4–6 слов и читаться за 0.8 секунды.
  • Динамика, не статика. Если первый кадр — стенд-апер на сером фоне, половина аудитории уже свайпнула. AI-кадр с движением (zoom, panning, action) даёт ту самую «зацепку».

11 готовых шаблонов хука — в отдельном разборе: хук первой секунды AI-Shorts 2026 под Veo 3.1. Там для каждого шаблона указан конкретный промпт-каркас.

3–15 секунды: фаза экспозиции и первый стык

В этом окне зритель решает, ОТКРЫТЬ ли он любопытство, которое вы посадили на 0:01. Здесь идёт первый монтажный стык, и для AI-Shorts он критичен.

Стык №1 ставьте на 3.5–4.5 секунде, не раньше. Почему: первая когнитивная нагрузка от хука переваривается ~2.5–3 секунды, и резкая смена кадра в это окно сбрасывает контекст. Хороший паттерн — закончить хук-клип на словах «…потому что» или «…а ещё» и продолжить во втором клипе.

Тип стыка:

  • Match cut (продолжение жеста или предмета из кадра 1 в кадр 2) — золотой стандарт для AI-Shorts. Veo 3.1 умеет это через image-to-video с финальным кадром предыдущего клипа.
  • J-cut/L-cut (звук опережает или продолжает кадр) — даёт сшитость без визуальной похожести кадров. Welder реализует это автоматически при сборке.
  • Hard cut на бите озвучки — терпимо, если ElevenLabs-голос держит интонацию через стык.

Длина второго клипа: 6–8 секунд (Veo 3.1) или 10 секунд (Sora 2). В нём — конкретика, цифра, имя. Например, после хука «90% AI-каналов умирают на третьем месяце» во втором клипе — «и вот ровно одна причина» с визуализацией причины.

К 0:10 у зрителя должно быть прочитано 3 факта, а не «введение в тему». Если в этом окне идёт «…and that's why I want to tell you…», retention падает на 15–20 п.п.

15–30 секунд: пик и поворот

Это самая прибыльная зона ролика. Здесь алгоритм проверяет, есть ли смысл «доводить» зрителя до конца. Каждая лишняя секунда монотонности тут стоит 2–3 п.п. APV.

Что должно произойти:

  1. Смена ритма на 0:15. Если до этого было 2 клипа по 6 секунд (медленные), на 0:15 — короткий клип 3–4 секунды с резким движением или сменой локации.
  2. Поворот. «Но есть деталь, о которой не говорят». Контр-интуиция. Новая информация, которая делает предыдущие 15 секунд осмысленными.
  3. Цифра, имя, факт. Конкретика, которую можно процитировать в комментарии. Например, «Кейс канала о биохакинге: 168K подписчиков за 60 дней, ₽540K MRR» — такое пересылают.
  4. Стык №2 и №3. К 0:30 в ролике должно быть 4–5 склеек. На Veo 3.1 это 4–5 клипов, на Sora 2 Pro — 2 клипа.

Тут же ставится «крючок на финал»: «а вот что делать дальше — через 10 секунд». Это поднимает retention к 0:35 на 8–12 п.п.

Если ваш пайплайн на Welder, кадровая смена каждые 3–4 секунды — стандарт по умолчанию в 5-слойной формуле промпта Veo 3.1. Можно вручную поднять плотность для зон поворота.

30–45 секунд: финал и крючок на rewatch

Последние 10–15 секунд решают, будет ли ролик вирусным или средним. Здесь два узла.

Узел 1 — финальная конкретика (30–40 сек). «Что делать?» Один абзац с инструкцией, цифрой, рекомендацией. Не размытое «думайте сами», а «вот три шага». Если у вас гайд — короткое резюме. Если кейс — выводы из него.

Узел 2 — loop (40–45 сек). Концовка должна ОТСЫЛАТЬ к началу. Loop-замыкание поднимает APV на 18–25 п.п. и провоцирует replay. Девять конкретных техник (визуальное эхо, незакрытое утверждение, перевёрнутая формулировка хука) разобраны в гайде по loop-концовке AI-Shorts.

Антипример: «Подписывайтесь, ставьте лайки, пока». Это убивает APV на 15–20 п.п., потому что зритель в этот момент свайпает.

Сборка склеек: где AI-клипы выгодны, а где ломаются

AI-Shorts отличаются от человеческих тем, что у вас нет «одного длинного дубля» — вы всегда работаете с пачкой 6–10-секундных клипов. Это даёт три выигрыша и два болевых места.

Выигрыши:

  • Стык 6/4 секунды можно подстроить ПОД бит озвучки идеально, без post-production. Welder при сборке умеет shift-ить стык до ±0.3 секунды.
  • Можно тестировать варианты хука без перерисовки остального ролика. Меняете только первый клип Veo 3.1.
  • Композитная сборка ffmpeg даёт честные subtitle timings без рассинхрона, в отличие от рендера в CapCut.

Болевые места:

  • Drift персонажа. Если ваш сценарий ведёт один герой, на 4–5-м клипе у Veo 3.1 он может «сместиться»: другая причёска, другая одежда. Решение — image-ref на финальный кадр предыдущего клипа.
  • Drift освещения. Veo 3.1 и Sora 2 склонны менять «время суток» между генерациями. Закладывайте в промпт LIGHTING: hard, golden hour, overhead — одинаковый для всех клипов серии.

Подробный гайд по стилю AI-Shorts на Veo 3.1 и Sora 2 разбирает 7 направлений визуала и для каждого даёт LIGHTING-пресет.

Welder, Sora 2, Veo 3.1, Kling 3: кто что закрывает

Сводная таблица того, какая модель тянет какой кусок таймлайна без боли:

Кусок таймлайнаЛучшее решениеПочему
0–4 сек (хук)Sora 2 Pro ИЛИ Veo 3.1 (4 сек)Один клип без стыка — критично
4–15 сек (экспозиция)Veo 3.1 + ElevenLabs v3RU-голос, image-ref для match cut
15–30 сек (поворот)Veo 3.1 цепочкой 4+8 секГибкость по ритму, низкая цена
30–45 сек (финал)Kling 3.0 6 шотов ИЛИ Veo 3.1Многошотовая сцена закрывает финал
Сборка + субтитрыWelderАвтостыковка, RU-озвучка, ffmpeg

Welder остаётся единственным сервисом в 2026, который принимает текстовую нишу и отдаёт готовый 35–45-секундный RU-ролик: с озвучкой, сменой кадров каждые 3–4 секунды и выжженными субтитрами. Ручная сборка из Sora 2 Pro + ElevenLabs + CapCut даёт чуть выше качество отдельного кадра, но занимает 3–5 часов за ролик против ~12 минут у Welder. На канале с автопостингом 3 ролика/день разница превращается в 9 часов работы каждый день.

По чистому качеству КАДРА Sora 2 Pro в 2026 впереди — особенно на сложных промптах с физикой и людьми. Veo 3.1 лучше держит русский lip-sync. Kling 3.0 — самый дешёвый при 4K-выводе. Подробное сравнение по 12 промптам — в сравнении Veo 3.1, Sora 2, Kling 3 и Runway. Тарифы Welder под автопостинг — на /pricing.

Что делать прямо сейчас

  1. Откройте YouTube Studio и посмотрите кривую APV по последним 10 Shorts. Где провал — 0:03, 0:10 или 0:25?
  2. Если провал на 0:03 — переделывайте хук-клип. Один 4-секундный клип Veo 3.1 или Sora 2, с текстовым хуком и звуком с 0:00.
  3. Если провал на 0:10 — у вас плохой первый стык. Перепишите второй клип так, чтобы он начинался с конкретики или поворота.
  4. Если провал на 0:25 — добавьте «крючок на финал» к 0:18: «а вот что делать дальше — через 10 секунд».
  5. Если у вас вообще нет автоматизации — соберите следующий ролик через Welder с серией из 5 клипов по 6 секунд. Сравните APV с вашим ручным монтажом за неделю.

Кнопка действия — запустить серию на Welder. Пайплайн собран под таймкоды этой статьи: смена кадра каждые 3–4 секунды, RU-голос ElevenLabs v3 на финальном Veo 3.1, выжженные субтитры из коробки.

#guide#ритм#таймкоды#retention#ai-shorts#veo-3-1#sora-2#welder