Главное за 30 секунд
В июне 2026 у вас есть четыре серьёзных видео-модели, чтобы делать AI-Shorts для YouTube, TikTok, Reels и VK Клипов: Veo 3.1 от Google ($0.20–0.40/сек, нативный 4K и звук), Sora 2 Pro от OpenAI ($0.30–0.70/сек, но API уходит на покой 24 сентября 2026), Kling 3.0 от Kuaishou (~$0.075/сек, мультикадр и физика) и Runway Gen-4.5 ($12/мес подписка, лучший контроль кадра).
Welder AI собирает пайплайн вокруг Veo 3.1 и Kling 3.0: от 1 690 ₽/мес за серию из ≈15 готовых видео с RU-голосом ElevenLabs, обложкой и автопостингом. Дальше — что выбрать под ваш сценарий и почему ставка только на Sora 2 в 2026 опасна.
Что изменилось в апреле–июне 2026
Главная новость рынка: OpenAI депрекейтнул Sora 2 26 апреля 2026 года, API закроется 24 сентября 2026. Параллельно с января 2026 бесплатные пользователи Sora внутри ChatGPT больше не могут генерировать видео — только Plus и Pro. Это не значит «Sora мертва», но любая бизнес-история на её основе теперь живёт в очень узком окне.
В это же время Google выкатила Veo 3.1 с нативным 48 kHz диалогом, а не только SFX, что закрыло главное преимущество Sora — синхронный звук с речью. Vertex AI стал основным API-каналом: $0.40/сек за стандарт, $0.20 за Fast, $0.05 за Lite. ChatGPT Plus и Google AI Ultra при этом подняли цены до $20 и $249 соответственно.
Kuaishou ответила Kling 3.0 — моделью «Omni One», которая делает мультикадровые ролики 3–15 секунд с физикой, чейн-оф-сота для сложных сцен и нативной мультиязычной озвучкой. На WaveSpeed и EvoLink текст-в-видео от $0.075 за секунду — самый дешёвый production-tier на рынке.
Runway встала особняком. Gen-4.5 закрепился как pro-инструмент для тех, кому нужен motion brush, reference-driven персонажи и точные камера-муви. С 2026 года Standard за $12/мес включает доступ к собственным моделям Runway плюс Veo 3.1, Kling 3.0, Seedance, FLUX и Seedream — один счёт на пять движков сразу.
Hailuo 02 (MiniMax) держится в нише ультра-бюджета: $0.045/сек на 768p, 6-секундный клип ≈ $0.28. Luma Ray2 — $0.38 за 5 секунд через Plus за $30/мес.
Параметры теста
Я взял 12 промптов под типовые форматы AI-Shorts на российском рынке: автообзор Tesla Y 2026, городская легенда про Москву, нарезка из научпопа про квантовый компьютер, кулинарный how-to, путешествие по Сочи зимой, исторический ролик про Куликовскую битву, talking-head про инвестиции, faceless-сторителлинг от первого лица, ASMR-кафе, спортивный таймлапс с ЧМ-2026, детский научпоп и анонс продукта.
На каждой модели прогнал один и тот же промпт с 8-секундным таргетом, 1080p, вертикалью 9:16 (где модель поддерживает — иначе пересобирал из 16:9 в Premiere). Считал три метрики: time-to-first-frame, стоимость генерации и subjective quality score (1–10) по hook-силе, lip-sync и физике объектов.
Результаты сводной таблицы — ниже.
Сравнительная таблица: что и сколько стоит
| Модель | Цена за сек (1080p) | Макс длина клипа | Native audio | Multi-shot | Контроль | RU-промпт |
|---|---|---|---|---|---|---|
| Veo 3.1 Standard | $0.40 | 8 сек | Да, 48 kHz, диалог | Нет (одна сцена) | Средний | Хороший |
| Veo 3.1 Fast | $0.20 | 8 сек | Да | Нет | Средний | Хороший |
| Sora 2 Pro 1080p | $0.70 | 25 сек | Да | Через storyboard | Средний | Хороший |
| Sora 2 720p | $0.10 | 12 сек | Да | Через storyboard | Низкий | Хороший |
| Kling 3.0 1080p | $0.075–0.10 | 15 сек | Да, мультиязык | Да, storyboard | Высокий | Отличный |
| Runway Gen-4.5 | подписка от $12/мес | 60 сек char-consistent | Да | Да | Очень высокий | Средний |
| Hailuo 02 Standard | $0.045 (768p) | 6 сек | Нет | Нет | Низкий | Средний |
| Luma Ray2 | $0.076 (5 сек) | 10 сек | Limited | Нет | Средний | Средний |
| Welder (Veo 3.1 + Kling 3) | от 290 ₽ за серию | до 90 сек ролик | ElevenLabs RU | Да, через сценарий | Высокий | Нативный RU |
Цены округлены до состояния начала июня 2026. Detail-разница: Sora 2 720p выглядит как «дёшево», но это watermarked-режим без коммерческой лицензии для бесплатного тарифа. Hailuo 02 не делает звук — придётся подкладывать ElevenLabs отдельно. Самый честный effective per-second у Kling 3.0 — $0.075 за секунду в 1080p с native audio.
Кейс 1: faceless-канал автообзоров
Запрос: «вертикальный 8-секундный шот Tesla Model Y 2026, январь, заснеженная парковка ТЦ Авиапарк, тёплый закат, камера медленно облетает машину, в окнах отражается салют от китайского нового года». Голос диктора на русском, тон «по-журналистски разбираем неочевидное».
- Sora 2 Pro 1080p: $0.70 × 8 = $5.60 за один шот. Качество отражения салюта в окнах — на голову выше остальных, но 7 шотов на одно видео — это $39.20 чистого generation cost. Для канала на 30 видео в месяц = $1176, и это без озвучки, обложки, рендера. Дорого.
- Veo 3.1 Standard: $3.20 за шот, реалистичный снег, голос диктора синхронно с движением камеры. Отражения слабее, но видны. 7 шотов = $22.40. На месяц = $672.
- Kling 3.0 1080p: $0.60 за шот, физика снега и салюта работает, lip-sync с озвучкой через Kling O3 даёт связную сцену. 7 шотов = $4.20. На месяц = $126.
- Welder на Veo 3.1: серия из 30 видео = тариф Creator за 5 290 ₽/мес (~$58). Внутри — генерация Veo 3.1 + ElevenLabs голос + автообложка + автопостинг во все соцсети.
Победитель: Kling 3.0 по price/quality для конкретного шота, Welder по совокупной стоимости пайплайна. Если вы строите канал на 30+ видео в месяц, разница между сборкой руками и Welder — десятки тысяч рублей и 40 часов вашего времени.
Похожий разбор по другим нишам мы делали в кейсе AI-канала автообзоров на 198K за 70 дней — там видно, как именно конвертится этот пайплайн в деньги.
Кейс 2: научпоп с динамичной визуализацией
Запрос: «квантовый компьютер IBM Quantum System Two, 433-кубитный процессор Osprey крупным планом, золотые соединительные провода, синяя криогенная оптика, медленный zoom-in». Диктор объясняет на русском, что такое суперпозиция, за 8 секунд.
- Veo 3.1 Standard: $3.20. Лучший результат по технической достоверности — золотые провода выглядят как на референсных фото IBM, диктор объясняет суперпозицию синхронно с zoom-in. Это та сцена, ради которой стоит платить Veo цену.
- Sora 2 Pro 1080p: $5.60. Кадр кинематографичный, но процессор выглядит «по мотивам» — отчасти как у Tesla Optimus, отчасти как пресс-фото NASA. Для научпопа это минус.
- Kling 3.0: $0.60. Физика кадра ок, но техническая сторона хромает — кубиты выглядят как лампочки гирлянды.
- Runway Gen-4.5: внутри Standard-подписки $12/мес. Через reference image (загружаем пресс-фото IBM) — самый точный технический результат, но 25 credits/sec за Gen-4.5 = месячный квот 625 credits = 25 секунд видео. Хватит на 3 шота. Не вариант для конвейера.
Победитель: Veo 3.1 Standard для технического научпопа без референсов; Runway Gen-4.5 — если у вас есть точное изображение под кадр и нужно ≤3 шота за месяц.
Промпт-инженеринг под Veo 3.1 — отдельная история. Мы разобрали 5-слойную формулу в гайде по промпту Veo 3.1 — для научпопа без неё не получится точно.
Кейс 3: storytelling от первого лица, 30-секундный ролик
Запрос: «городская легенда про Метро-2 в Москве», 30 секунд = четыре последовательные сцены. Закадровый голос рассказчика на русском с лёгким шёпотом.
- Sora 2 Pro: одно generation = 25 сек × $0.70 = $17.50. Но 30 сек требует два generation = $35. И storyboard-режим в Sora 2 нестабилен после депрекейта.
- Kling 3.0 multi-shot mode: 30 сек = 4 шота по 8 сек × $0.10 = $3.20. Native audio sync держит голос рассказчика через все четыре кадра без склейки.
- Veo 3.1: 4 generations × $3.20 = $12.80, склейка в ffmpeg вручную, голос — отдельно через ElevenLabs.
- Welder: одна серия = автоматически 3–10 видео по 60–90 сек, режим voiceover, ElevenLabs RU-голос, обложки, автопостинг. Тариф Starter 1 690 ₽/мес = ≈15 готовых роликов.
Победитель: Welder для повторяемого продакшна; Kling 3.0 multi-shot, если вы делаете 1–2 ролика руками для своей ленты.
Где проигрывает Welder
Честно: если вам нужен motion brush на уровне Runway Gen-4.5, точечная анимация лица, или вы агентство, которое снимает один-два ролика в месяц с extreme creative control — Welder не для вас. Welder заточен под конвейер: 15, 50, 180 роликов в месяц на одного оператора, RU-нативная озвучка, автопостинг, серии с каноном персонажей.
Если у вас одна продакшен-сцена «на годовой ролик клиента» — Runway Gen-4.5 за $76/мес Unlimited даст вам качество, до которого Welder не дотянется.
Sora 2: продолжать ставку или мигрировать
С учётом депрекейта 26 апреля 2026 и закрытия API 24 сентября 2026, любой канал на Sora 2 живёт три с половиной месяца до полного reset. Что делать:
- Если вы канал на Sora 2 720p ($0.10/сек) и аудитория уже сложилась: мигрируйте на Kling 3.0 — ближе по style по результатам теста. Welder подключает Kling 3.0 в режиме voiceover с RU-озвучкой ElevenLabs.
- Если вы Sora 2 Pro 1080p для премиум-контента: мигрируйте на Veo 3.1 Standard. Это самая безопасная ставка на 2026–2027 — Google вряд ли деприкейтит флагманскую модель в ближайшие 18 месяцев.
- Если вы только начинаете: не начинайте с Sora 2. Это короткое окно, через 3 месяца придётся всё переделывать.
Тарифы Welder уже включают и Veo 3.1, и Kling 3.0 — вы переключаете между ними прямо из дашборда, без перенастройки промптов.
Режиссура: какая модель уважает ваш промпт
Промпт-понимание — отдельная метрика. Вот моя субъективная шкала из теста:
- Veo 3.1: понимает многослойные промпты с камерой, светом, эмоцией. Иногда переинтерпретирует — добавляет действия, которые вы не просили.
- Sora 2 Pro: отлично понимает «стиль» (нуар, ретро-80е, киберпанк), хуже — детальные параметры кадра.
- Kling 3.0: лучше всех держит физику (тяжесть объектов, разрыв ткани, движение жидкости). Хуже понимает «настроение».
- Runway Gen-4.5: понимает то, что вы нарисовали. Если у вас есть reference — он сделает идеально. Чисто текстовый промпт без референса — слабее, чем у Veo.
- Hailuo 02: понимает action-сцены и кулинарию. Сложные диалоги — нет.
Если хотите глубже погрузиться в режиссуру через текст — мы разбирали 10 параметров кадра для Veo 3.1. Те же приёмы работают на Sora 2 и Kling 3.0 с минимальной адаптацией.
Что выбрать под ваш сценарий
Короткая шпаргалка после 12 промптов:
- Faceless-канал на 30+ роликов/мес: Welder на тарифе Creator 5 290 ₽/мес. Под капотом Veo 3.1 + Kling 3.0 + ElevenLabs RU + автопостинг.
- Премиум-контент с кинематографическим качеством, ≤5 роликов/мес: Veo 3.1 Standard на Vertex AI ($3.20 за 8 сек) + ElevenLabs руками. Бюджет $250+ в месяц при ручном пайплайне.
- Storytelling 30+ секунд с native audio: Kling 3.0 в multi-shot режиме ($0.075/сек) или Welder voiceover (от 1 690 ₽/мес за все 15 видео).
- Один рекламный ролик клиенту с максимальным контролем: Runway Gen-4.5 Standard ($12/мес), motion brush + reference frames.
- Стартап, $0 бюджет на тест: бесплатный тир Veo 3.1 Lite через Gemini API (с лимитами) или 125 credits Runway Free.
- Sora 2 канал: миграция до 24 сентября 2026. Подождать обещанную Sora 3 — пустая трата трёх месяцев.
Главный вывод теста: эпоха «одна модель — один канал» закончилась. Production-грейд канал в 2026 микширует 2–3 модели под разные сцены и упаковывает это в один пайплайн. Welder делает это автоматически. Руками — нужен ffmpeg, доступ к 3 API и 40+ часов в месяц.
Действие на эту неделю
Если вы держите канал на одной модели и видите этот пост в июне 2026, у вас два варианта.
Первый — открыть Welder, запустить серию из 10 роликов под вашу нишу на тарифе Starter за 1 690 ₽ и сравнить retention с тем, что вы делали раньше. Это 30 минут работы и одни выходные на наблюдение за метриками.
Второй — построить мульти-модельный пайплайн руками: завести Vertex AI, подключить Kling 3.0 через WaveSpeed, прикрутить ElevenLabs и Streamlit-фронт. Это две недели и $200 в месяц на API без видео-результатов на старте.
Любая модель из теста — Veo 3.1, Sora 2, Kling 3.0, Runway Gen-4.5 — это просто двигатель. Производственный пайплайн — это руль, коробка передач и колёса. Если ваша задача — снимать 30 роликов в месяц, а не выбирать самый красивый двигатель, начните с пайплайна.