Главное за 30 секунд
В мае 2026 средняя длина AI-Shorts ушла к 60 секундам, а планка retention поднялась: алгоритм YouTube Shorts ждёт выше 80% удержания на первой секунде и выше 70% average percentage viewed на финале. Без структуры сценария вы это не вытянете — даже на Veo 3.1 и ElevenLabs v3.
Структура — это не «творческое самовыражение», это шаблон удержания. Ниже 7 рабочих скелетов, которые мы используем на каналах в Welder AI: HBC, PAS, Loop, List, 3-Act Micro, POV и Myth-Bust. Каждый — с примером сценария на 60s, с указанием ниши и LLM, который его пишет лучше всего.
В конце — сравнительная таблица «структура → ниша → метрика», и пошаговый чек-лист, как из текста дойти до готового ролика.
Почему структура важнее темы
Открытые данные за 2026 говорят одно и то же: 71% зрителей решают остаться или свайпнуть в первые 3 секунды. Если хук не сел — тема, голос и качество Veo 3 уже не спасают. Поэтому первая строка сценария = первый кадр = первое слово диктора. Это не три отдельных задачи, это одна.
Дальше — кривая удержания. На YouTube Shorts хорошим считается:
- ≥80% на отметке 3 сек («swipe or stay»);
- ≥60% на середине;
- ≥70% average percentage viewed на финале.
В TikTok добавляется loop-rate (повторные просмотры от тех же зрителей). На AI-каналах с шаблонными визуалами loop-rate выходит решающей метрикой: один и тот же зритель пересматривает ролик 1.4–1.8 раза, и это удваивает охват.
Структура сценария — единственный рычаг, которым креатор управляет всеми тремя цифрами сразу. Тема даёт интерес, визуал держит внимание, но именно структура определяет, дойдёт ли зритель до второго рывка алгоритма.
Подробнее про первую секунду — в нашем разборе 12 формул хука для AI-Shorts. Здесь идём дальше: как развернуть хук в полноценный 60-секундный сценарий.
1. HBC — Hook / Body / CTA
База, на которой стоит всё короткое видео. Три блока, фиксированные пропорции под 60 секунд:
- Hook — 0:00–0:05 (одно ударное предложение + визуал-шок);
- Body — 0:05–0:50 (3–5 микро-блоков по 8–12 секунд);
- CTA — 0:50–0:60 (открытый цикл или прямое действие).
Когда работает: универсальная структура. Подходит под любую нишу, если автор пока не знает, что именно он хочет сказать.
Пример сценария (ниша — «факты о космосе»):
Hook: «Юпитер не может стать звездой. И вот почему — слушай 50 секунд». Body: 4 факта о массе, давлении, водородном слиянии, температуре ядра. CTA: «Если интересно, что мешает Сатурну — подписывайся, разберу завтра».
Минусы HBC — он быстро надоедает зрителю, если повторять без вариаций. Поэтому в Welder мы добавляем рандомизацию: один из 4 микро-блоков всегда визуально неожиданный (смена ракурса, цветовой акцент, контр-кадр).
LLM, который лучше всех пишет HBC под объём — ChatGPT (GPT-5). Он держит ритм 60-секундного сценария и не «растекается». Claude Sonnet 4.6 пишет более литературно, но Body выходит на 80 секунд — приходится резать.
2. PAS — Problem / Agitate / Solution
Классика копирайтинга, идеально работает в product-нишах и в любом контенте, где есть «боль зрителя».
- Problem (0:00–0:10): называете конкретную боль читателя в лоб.
- Agitate (0:10–0:35): усиливаете — почему это срочно, что теряется.
- Solution (0:35–0:55): один шаг, одно действие, одна ссылка.
- CTA (0:55–1:00): «попробуй сейчас».
Когда работает: монетизация (продукты, услуги, курсы), а также образовательный контент с прикладным углом. Например, гайды по карьере, фрилансу, инструментам.
Пример сценария (ниша — фриланс с AI):
Problem: «Ты тратишь 6 часов на один ролик, а зарабатываешь как 3 года назад». Agitate: «Конкуренты сдают по 8 шортсов в день и закрывают $2000 в неделю. А ты — нет». Solution: «Welder делает 10 роликов за час. Один промпт — серия». CTA: «Жми, попробуй на одном видео — бесплатно».
Главная ошибка в PAS — слабый Agitate. Если этап «боли» рыхлый, вся структура рассыпается. Зритель должен в эти 25 секунд успеть подумать «это про меня» минимум дважды.
LLM-выбор: Claude Opus 4.7 пишет лучший Agitate — он умеет нагнетать без штампов. Для Solution и CTA берите ChatGPT — короче и конкретнее.
3. Loop — открытый цикл
Структура, специально заточенная под loop-rate. Последнее предложение сценария плавно перетекает в первое — зритель не замечает, что ролик закончился, и видео заходит на второй круг.
Шаблон:
- Hook (0:00–0:03): фраза-кольцо, начинающаяся с предлога или союза. «Поэтому...», «И вот почему...», «Так получилось, что...».
- Body (0:03–0:55): обычное развитие.
- Closer (0:55–1:00): фраза, которая логически приводит обратно к первой.
Когда работает: ИИ-каналы про факты, мифологию, исторические загадки, ASMR-storytelling. Любая ниша, где зритель может «потеряться» и не понять, что ролик зациклился.
Пример (ниша — мифология):
Hook: «...поэтому Зевс и боялся одного-единственного титана». Body: рассказ про Кроноса и пророчество. Closer: «И когда Зевс впервые услышал это пророчество — он понял, что бояться надо одного-единственного титана...» → возврат на Hook.
Welder автоматически предлагает Loop-структуру, если канал подписан на «мифология», «история», «факты». Подробнее про сам механизм зацикливания — как поднять loop-rate в AI-Shorts.
LLM-выбор: Claude Sonnet 4.6 — лучше всех держит «кольцо» по смыслу. ChatGPT часто рвёт логику между Closer и Hook.
4. List / Top-N
Самая надёжная структура для эдьютейнмента и faceless-каналов. Простая, но именно поэтому почти все AI-каналы про факты используют именно её — алгоритм её любит за чёткий ритм.
- Hook (0:00–0:05): «5 фактов о Древнем Риме, которые не покажут в школе».
- Items (0:05–0:55): 5 пунктов × 10 секунд каждый.
- Closer (0:55–1:00): «Подписывайся — завтра топ-5 про гладиаторов».
Когда работает: история, наука, мифы, лайфхаки, рейтинги, чек-листы. Это структура для масштабирования: один шаблон → 30 роликов в месяц.
Важные нюансы List-структуры на 60 секунд:
- 5 пунктов = 10 секунд каждый = ровно по одной мысли;
- 7 пунктов = 8 секунд каждый = темп жёсткий, но работает в нишах «лайфхаки» и «быстрые факты»;
- 3 пункта = 18 секунд каждый = развёрнутые мысли, для «глубоких» ниш;
- Не делайте 4 пункта — это самое нелюбимое алгоритмом число, ритм ломается.
Пример: на одном из наших каналов про античность 5 фактов в ролике дали 4.2% average engagement против 2.8% у 3-pointer-структуры. Разница — в темпе, не в теме.
LLM-выбор: Gemini 2.5 Pro. Он лучше всех других моделей собирает релевантные фактоиды одновременно из вики, новостей и архивов. Для перевода в сценарий — ChatGPT.
5. 3-Act Micro
Микро-нарратив на 60 секунд. Setup → Confrontation → Resolution. Это структура для «мини-истории», когда у вас есть герой и арка изменения.
- Act 1 — Setup (0:00–0:15): кто, где, чего хочет.
- Act 2 — Confrontation (0:15–0:45): препятствие, конфликт, выбор.
- Act 3 — Resolution (0:45–0:60): результат + мораль или cliffhanger.
Когда работает: сюжетные ИИ-каналы (исторические истории, мифы, fantasy-storytelling). Каналы, которые делают «эпизоды» — то есть продают зрителю продолжение, а не одиночный ролик.
Пример (ниша — морские истории):
Act 1: «1912 год. Кочегар Титаника Артур Прист отправляется в свой шестой рейс — пятый из них кораблекрушением закончится». Act 2: «Он переживёт всё: Olympic, Titanic, Asturias, Alcantara, Donegal. Каждая катастрофа — новая». Act 3: «Он умер в 1937-м, в собственной кровати, в 49 лет. И до конца жизни боялся... ванны».
3-Act Micro идеально стыкуется с серийностью. Один ролик закрывается, другой открывается через cliffhanger в Act 3. Это и есть тот формат, который Veo 3.1 рендерит лучше всех — длинные планы, эмоциональные лица, кинематографичная драматургия.
LLM-выбор: Claude Opus 4.7 — единственная модель, которая надёжно пишет 3-Act под жёсткие 60 секунд без потери эмоции. ChatGPT и Gemini тянутся в драму, но обычно растекаются на 90+ секунд.
6. POV — Point of View / Character-First
Структура, набравшая силу в 2025–2026: вместо рассказа от третьего лица — обращение «ты». Зритель помещён внутрь сцены. Идеально для faceless-каналов с Veo 3.
Шаблон:
- Setup-POV (0:00–0:10): «Ты — рабыня на улицах Помпей за час до извержения».
- Action (0:10–0:50): что ты видишь, слышишь, делаешь.
- Twist/End (0:50–0:60): развязка от первого лица.
Когда работает: история, ужасы, fantasy, симуляторы профессий («ты — врач в Чернобыле»), VR-эстетика. На faceless-каналах POV даёт +34% к среднему watch time по сравнению с обычным повествованием — мы видели это в A/B-тестах на каналах внутри Welder.
Visual-side: POV любит Veo 3.1 за консистентные характеры в кадре. Если же вы делаете ролик на Sora 2 или Kling 2.5, перепроверьте, что «герой» в кадре действительно тот же на всех планах — у этих моделей бывает дрейф персонажа. Полная инструкция по таким промптам — в нашем разборе 8 паттернов промпта Veo 3.
LLM-выбор: Claude Sonnet 4.6 пишет POV без пафоса. ChatGPT любит сваливаться в «эпический тон» — это для POV плохо.
7. Myth-Bust / Contrarian
Структура для виральности. Хук — провокация, тело — доказательство, финал — переосмысление.
- Hook (0:00–0:05): «Всё, что ты знаешь про X — неправда».
- Evidence (0:05–0:45): 2–3 факта или источника, разрушающих миф.
- Replacement (0:45–0:60): новое понимание + CTA «обсуди в комментариях».
Когда работает: исторические каналы («Колумб не открывал Америку»), научные («витамин C от простуды не помогает»), мотивационные («работать по 12 часов — это не работа»), околобизнесовые.
Подводный камень: если в Evidence нет реальных источников — канал быстро умирает в shadow-ban. Алгоритм YouTube за 2025–2026 научился чувствовать «фейковую сенсацию» через паттерны жалоб. В Welder для Myth-Bust есть фильтр: модель не выпустит сценарий без ссылок на минимум 2 авторитетных источника.
LLM-выбор: Gemini 2.5 Pro. Единственный, у кого есть свежий доступ к веб-индексу из коробки. Claude и ChatGPT для этой структуры лучше использовать как редактор, не как первичный автор.
Сравнительная таблица: структура → ниша → LLM
| Структура | Лучшая ниша | LLM-автор | Целевая метрика | Сложность |
|---|---|---|---|---|
| HBC | универсально | GPT-5 | Hook retention 80% | низкая |
| PAS | продукт, монетизация | Claude Opus 4.7 | CTR на CTA | средняя |
| Loop | мифы, факты, ASMR | Claude Sonnet 4.6 | loop-rate 1.4x+ | средняя |
| List / Top-N | факты, история, лайфхаки | Gemini 2.5 Pro | масштаб (30+/мес) | низкая |
| 3-Act Micro | сторителлинг, эпизоды | Claude Opus 4.7 | average view duration | высокая |
| POV | faceless, ужасы, симы | Claude Sonnet 4.6 | watch time +30% | высокая |
| Myth-Bust | наука, история, бизнес | Gemini 2.5 Pro | virality, shares | высокая |
Подбор структуры под нишу — не догма. Один и тот же канал может ротировать 2–3 структуры в неделю и получать прирост в 15–20% к средним просмотрам — алгоритм YouTube Shorts любит «непредсказуемый» контент в рамках одного канала.
Какой LLM писать сценарии в 2026
Короткий маршрут:
- Claude Opus 4.7 — драма, эмоция, длинные арки, PAS. Лучший выбор для каналов с нарративом.
- ChatGPT GPT-5 — быстрая структура, чёткие CTA, HBC. Лучший выбор для контент-фабрики.
- Gemini 2.5 Pro — факты, цифры, веб-индекс, Myth-Bust. Лучший выбор для эдьютейнмента.
В Welder под капотом используется маршрутизатор: модель сценария выбирается не пользователем, а системой — на основе выбранной ниши и структуры. Если вы пользуетесь общими решениями (GigaChat, YandexGPT, универсальные телеграм-боты к OpenAI), переключение между моделями придётся делать руками.
Цены прикинуть тоже стоит. На один сценарий 60s тратится в среднем 1.5K input + 600 output токенов. По ценам мая 2026:
- GPT-5: ~$0.013 за сценарий
- Claude Opus 4.7: ~$0.024 за сценарий
- Gemini 2.5 Pro: ~$0.008 за сценарий
В пересчёте на 30 роликов в месяц — это $0.24–$0.72. Сценарий — не статья расходов. Главное — голос (ElevenLabs v3 — $5–22/мес) и видео-рендер (Veo 3 — около $0.50 за 8 секунд). Сводный расчёт стоимости серии — на странице тарифов.
Что делает Welder AI со сценарием
Сценарий — это половина пайплайна. Дальше его нужно разобрать на сцены, описать промптами под Veo 3.1 (или Sora 2 / Kling 2.5 — пользователь выбирает), отдать в озвучку ElevenLabs, собрать на тайминге и приклеить субтитры.
В Welder это один маршрут:
- Пользователь выбирает нишу и тип канала.
- Welder подбирает 2–3 структуры (например, List + Loop + 3-Act).
- Маршрутизатор отправляет в Claude / GPT / Gemini в зависимости от структуры.
- Сценарий → сцены → промпты → рендер → озвучка → монтаж.
- На выходе — 10 готовых вертикальных роликов с обложками.
Конкуренты-телеграм-боты с прямым доступом к Veo 3 такого пайплайна не дают — там вы получаете 8-секундный клип за промпт, без сценария, без серии, без озвучки. Подробнее эту разницу мы разбирали в Telegram-боты с Veo 3 vs Welder.
Если вы только начинаете — попробуйте на одной серии: один промпт, одна ниша, одна структура. Дальше становится понятнее, какая из 7 даёт ваш голос. Тарифы Welder и расчёт под объём — на странице /pricing.
Чек-лист перед запуском (5 минут)
Прежде чем нажать «Сгенерировать»:
- Я выбрал одну структуру из 7 (не «всё подряд»).
- Мой Hook — это одно предложение длиной ≤12 слов.
- В Hook есть «крючок»: цифра, контр-факт, вопрос или POV-обращение.
- Body разбит ровно на нужное число блоков по структуре (3, 5, 7).
- Closer либо ведёт обратно в Hook (Loop), либо даёт открытый вопрос, либо CTA.
- Сценарий помещается в 130–150 слов (примерно 60 секунд диктора).
- Я знаю, какой LLM пишет эту структуру лучше всего.
- Я выбрал визуальную модель (Veo 3.1 / Sora 2 / Kling 2.5) под жанр сценария.
- Я понимаю, какой retention буду мерить и какой считать «победой».
Если все 9 пунктов — да, выпускайте серию. Если нет — переписывайте Hook, пока не получится.
Следующий шаг
Сценарий без рендера — это просто текст. Welder автоматизирует все 5 шагов после сценария: сцены, промпты, рендер, голос, монтаж. Один промпт — одна серия из 10 роликов.
Сделать первое видео — занимает 7 минут, не требует карты, RU-голоса по умолчанию.