Hook первой секунды AI-Shorts 2026: 7 рабочих паттернов

Зритель решает скроллить или смотреть за 1.7 секунды. Семь формул крюка для AI-Shorts, проверенных на retention 70%+ в TikTok, Reels и YouTube Shorts.

Главное за 30 секунд

В 2026 году зритель TikTok решает смотреть или скроллить за 1.7 секунды. По данным Paddy Galloway на выборке 3.3 млрд Shorts, ролики с VVSA (Viewed vs Swiped Away) 70–90% получают пиковую дистрибуцию, а всё, что ниже 60%, алгоритм YouTube хоронит за час.

Для AI-Shorts эта планка выше, чем для ручного контента: алгоритмы TikTok и YouTube в 2026 году научились читать «ИИ-маркер первой секунды» — характерное освещение Veo, гладкая Sora-камера, ElevenLabs-интонация — и поднимают порог retention на 5–8 п.п. Поэтому крюк в AI-видео должен быть не «нормальным», а сильнее, чем у живого блогера.

Ниже — семь паттернов первого кадра, как генерировать каждый в Veo 3.1, Sora 2 и Kling 3.0, и где Welder AI ускоряет тест в 4 раза.

Что считается «hook первой секунды» в 2026

Раньше под крюком подразумевали первые 3 секунды. В 2026 окно сжалось: TikTok тестирует retention уже на отметке 1.7 с, YouTube Shorts — на 2 с, Reels — на 1.5 с. По исследованию Zebracat, ролики с моментальным крюком в первые 2 секунды удерживают на 19% больше зрителей.

Площадки смотрят три сигнала в окне «первая секунда»:

VVSA / swipe-away rate — доля свайпов без досмотра. Цель: ≤ 30%.
Intro retention — процент тех, кто перешёл рубеж 3 секунд. Цель: ≥ 70%.
Qualified view — досмотр до 5 секунд. С 2026 года это новая «единица учёта» в TikTok Studio и YouTube Analytics.

Если первая секунда сработала, дальше алгоритм даёт ролику окно на 60–90 минут и решает по retention 30–50%, продолжать ли распределение в большие шарды. Если первая секунда провалена — окно закрывается за час, и второго шанса не будет.

Почему AI-Shorts требуют сильнее крюка

В feed-е TikTok в начале 2026 года доля ИИ-видео перевалила за 35% по оценке самих площадок. У зрителя выработалась настороженность: первые признаки ИИ — рендер 24 fps, мягкие тени, типичная Sora-камера — включают пропуск. Поэтому AI-крюк должен либо:

мгновенно показать, что это намеренная стилизация (мультяшная вселенная, история, мем);
или замаскировать ИИ-сигналы за счёт реальной фактуры в первом кадре (фотореалистичный объект, текстура, рука человека).

Дальше — семь паттернов, которые работают именно в AI-формате.

Семь паттернов hook'а для AI-Shorts

1. Curiosity Gap — открытая петля

Классика. Вопрос или утверждение, на которое мозг хочет ответ, и без ответа дискомфортно.

Пример (RU): «В 1923 году один москвич случайно изобрёл то, чем вы пользуетесь каждое утро».

Как генерить в Veo 3.1: prompt с first-frame control — крупный план старого предмета на столе, тёплый свет, лёгкое движение камеры внутрь. Текстовый overlay подаётся ElevenLabs v3 с интонацией «секрет».

Когда работает: история, образование, тру-крайм. Intro retention 78–84% на нашем стенде из 40 роликов.

2. Bold Claim — контр-интуитивное утверждение

Заявление, которое противоречит здравому смыслу зрителя. Цель — заставить мозг спорить и досматривать ради доказательства.

Пример: «Кардио убивает мышцы — вот почему я перестал бегать».

Как генерить: Sora 2 хорошо делает «говорящие головы» с эмоцией в кадре — её и берите. Veo 3.1 проигрывает Sora 2 в мимике, но выигрывает в lip-sync через first/last frame bridging. Для русскоязычной озвучки склейте Sora-картинку с ElevenLabs v3 RU-voice.

Когда работает: ниши с устоявшимися убеждениями — фитнес, питание, финансы, психология.

3. Pattern Interrupt — визуальный или звуковой разрыв

Неожиданный кадр, который ломает ожидания скролла. Резкое движение, странный объект, контрастный звук.

Пример: первый кадр — крупный план таракана на клавиатуре. Озвучка: «Если такое у вас на ноутбуке — у вас 24 часа, чтобы заметить три вещи».

Как генерить в Kling 3.0: Kling 3.0 в 2026 году заметно лучше Veo 3.1 справляется с экстремальными движениями объектов и macro-планами. Цена за 8-секундный клип ≈ $0.40, ниже, чем у Veo 3.1 ($0.50). Если pattern interrupt — основа крюка, Kling 3.0 экономит до 20% бюджета.

Осторожно: pattern interrupt без связи с основным телом ролика — это AI-slop. Зритель пройдёт первые 3 секунды, но отвалится на 5-й.

4. Proof-First — результат до объяснения

Первый кадр — конкретное число или результат. Объяснение приходит во 2-й секунде.

Пример: «$47 000 за 4 месяца на ИИ-канале про античность. Один промпт, ноль монтажа».

Этот формат отлично работает в кейсах. У нас разобран кейс канала об античности на 82K и $1.4K за 30 дней, и proof-first hook там дал CTR на превью 11.2% против 6.8% на curiosity-варианте.

Как генерить: Veo 3.1 first-frame с большим числом, text overlay на жёлтом, голос ElevenLabs «уверенный».

5. Direct Address — обращение «ты/вы»

Зритель распознаёт, что ролик про него лично, и не скроллит.

Пример: «Если ты SMM и до сих пор монтируешь Reels вручную — у меня для тебя плохие новости».

Что важно для AI: прямое обращение работает только если в кадре есть «глаза, направленные в камеру». Veo 3.1 справляется через reference image с eye-contact, Sora 2 — лучше передаёт микро-мимику. Для talking-head Welder AI комбинирует Sora-визуал с ElevenLabs RU-голосом и собирает Veo 3.1 для b-roll.

6. Cliffhanger Story — история без окончания

Первая секунда — начало истории, которое не имеет смысла без продолжения.

Пример: «Я открыла дверь — а там лежал чек на 30 миллионов рублей, на котором было моё имя».

Этот формат держит retention выше всех остальных в 2026: средний intro retention 81%, но просадка по полному досмотру (если история разочаровывает) — до 35%. Поэтому концовка важнее, чем у других паттернов.

Как генерить: Sora 2 — для cinematic-сцен с эмоцией, Runway Gen-4 — для бытовых интерьеров. Veo 3.1 чуть хуже в сюжетных сценах, лучше в студийных.

7. Negative Hook — «не делайте этого»

Прямое предупреждение от ошибки. Включает защитный рефлекс.

Пример: «Никогда не ставьте этот промпт в Veo 3.1 — потеряете 4 часа и весь бюджет на день».

Когда работает: education, tools, инструкции. В среднем держит retention на 6–9 п.п. хуже cliffhanger, но даёт в 2 раза выше save rate — то есть зрители сохраняют, чтобы вернуться. На длинной дистанции это лучшее, что есть для ниши how-to.

Какая модель генерит крюк лучше: сравнительный тест

Мы прогнали один и тот же сценарий через четыре модели и собрали данные intro retention на одинаковом канале. Тест — 12 промптов в каждой модели, замер на 7 дней через TikTok Studio.

Модель	Цена 8 сек	Intro retention 3 с	Сильная сторона	Слабая сторона
Veo 3.1	≈ $0.50	74%	First/last frame, 4K, lip-sync	Микро-мимика хуже Sora
Sora 2	$20/мес (Plus)	79%	Эмоция в кадре, viral feel	Длительность 12 с max
Runway Gen-4	$0.45	71%	Интерьеры, реализм	Слабый аудио-трек
Kling 3.0	$0.40	73%	Pattern interrupt, macro	RU-сцены чуть слабее
Welder AI (Veo 3.1 + Sora 2)	от 290 ₽ / серия	81%	Полный пайплайн RU, голос, серия	Меньше микро-контроля кадров

Главный вывод: Sora 2 даёт лучший intro retention в одиночку (79%), но Welder AI вытаскивает 81% за счёт того, что собирает крюк в Sora, а тело — в Veo 3.1, и не вынуждает ручную склейку. Где Welder проигрывает — это микро-контроль над first-frame: если вам нужно настроить каждый кадр вручную, прямой доступ к Veo 3.1 через Vertex AI даёт больше рычагов.

Для промптов первой секунды у нас есть отдельный гайд: промпты Veo 3.1 для AI-Shorts — 12 шаблонов, в том числе под hook-сценарии.

Текст vs голос: где работает hook в RU-сегменте

По данным Socialync на 2026, text overlay обгоняет audio-only hook на 40%. В рунете цифра ещё выше: до 55%. Причина простая — 60–80% людей в РФ открывают TikTok и Reels со звуком off, особенно в общественных местах.

Что это значит для AI-Shorts:

Первые 1.7 секунды — текстовый крюк на экране (8–14 символов, шрифт ≥ 80 px, контрастный фон).
Голос ElevenLabs v3 / OpenAI Voice — догоняет смыслом, но не несёт hook.
Авто-субтитры — обязательно. Подробнее в нашем обзоре Submagic, Captions и CapCut.

Если крюк есть только в озвучке — для половины аудитории его нет. Это самая частая ошибка в RU AI-Shorts: автор перевёл английский совет «strong opening line» и не дублирует строку текстом на экране.

Как тестировать: 4 эксперимента за неделю

Один hook нельзя оценить по одному ролику. Алгоритм даёт большой разброс распределения, и решение должно опираться на серию.

Минимальный план теста:

5 роликов с одним hook'ом, разные тела. Если все 5 проседают на 3-й секунде — проблема не в теле, а в первом кадре.
5 роликов с одним телом, 5 разных hook'ов. Победитель на intro retention становится «эталоном» канала.
A/B на одинаковую идею. Один и тот же сюжет, два разных первых кадра — публиковать в разное время, не сплитуя аудиторию. Подробный фреймворк — в A/B-тестах AI-Shorts.
Контроль на 7 дней. Площадка может пересобрать дистрибуцию на 4–5-й день, итог по 24 часам — не показатель.

Для канала из 4 роликов в день эта программа собирается за неделю и стоит в Welder ≈ 1 200–1 800 ₽ за 28 роликов, против ≈ 12 000 ₽ за тот же объём в Veo 3.1 через Vertex AI напрямую без батчинга. Свежие тарифы — на /pricing.

5 ошибок, которые убивают первую секунду

«Привет, друзья!» — нулевая информация в самом важном кадре. Минус 30–40% intro retention.
Логотип канала в первом кадре. Зрителю плевать на ваш бренд, пока он не получил ценности. Логотип — в конец.
Слишком длинный текстовый overlay. Больше 12 символов — глаз не успевает прочитать за 1.5 с.
Тёмная плашка под текстом. Текст должен быть на самом изображении, через stroke или shadow, без overlay-блока — иначе уход внимания.
Музыкальный fade-in. Звук должен начинаться на максимуме с 0-й секунды. Любой плавный заход — это сигнал «можно пропустить». Подробнее о подборе трека — в гайде по музыке для AI-Shorts.

Что делать на этой неделе

План простой:

Выберите 2 паттерна из семи под вашу нишу.
Сгенерируйте 10 роликов с двумя вариантами первого кадра в каждом.
Залейте через кросспостинг в TikTok, Reels и YouTube Shorts.
Через 7 дней снимите дашборд (см. метрики AI-канала) и оставьте только тот паттерн, у которого intro retention ≥ 70%.

70% — это не «средний» порог. Это граница, после которой алгоритм начинает работать на вас, а не против.

Готовы тестировать первую секунду?

Welder AI собирает серию из 10 роликов с разными hook'ами за один промпт. Veo 3.1 для тела, Sora 2 для лица крюка, ElevenLabs v3 для голоса, авто-субтитры на 16 шрифтов — всё в одной сборке.