Wan 2.5, Vidu Q3, Hailuo 2.3: тихие топ-модели AI-видео 2026

Кто рендерит дешевле и быстрее Sora 2, но не светится в обзорах — и где они работают вместо Veo 3.1.

Главное за 30 секунд

В июне 2026 тройка Wan 2.5 (Alibaba), Vidu Q3 Pro (ShengShu) и Hailuo 2.3 (MiniMax) уже залезла в топ-10 Artificial Analysis, но в русскоязычных обзорах продолжают пересравнивать Sora 2, Veo 3.1 и Kling 3.

Что они дают креатору коротких видео:

Wan 2.5 — multi-shot 5–10 секунд, нативный синхронный звук (диалог + ambient), 1080p (нативное 4К обещают в Q1 2026), от ≈$0.08–0.12 за секунду через WaveSpeed / Atlas Cloud / KIE.
Vidu Q3 Pro — 16 секунд непрерывного видео со звуком в одной генерации, самый дешёвый в категории «нативный audio-video», топ-10 Artificial Analysis по итогам Q1 2026.
Hailuo 2.3 — 1080p до 10 секунд, лучшая физика тела и микро-мимика среди дешёвых моделей, $0.045/сек на 768p и $0.28 за полный 1080p-клип через fal.ai.

Модель	Релиз	Макс. длина	Разрешение	Нативный звук	Цена	Лучшее место
Wan 2.5 (Alibaba)	сент 2025	10 с	1080p (4К Q1 2026)	да, A/V sync	$0.08–0.12/с	multi-shot брендовый ролик
Vidu Q3 Pro (ShengShu)	янв 2026	16 с	1080p	да, 16 с подряд	от ≈$0.06/с	tutorial / talking-segment
Hailuo 2.3 (MiniMax)	28 окт 2025	10 с	1080p / 24–30 fps	через Media Agent	$0.045–0.28/клип	физика, мимика, anime
Veo 3.1 (Google) — для контекста	2025	8 с	1080p	да, lip-sync RU	≈$0.50/8с	RU lip-sync, проверенный API
Sora 2 (OpenAI) — закрывается сент 2026	2024–25	20 с	1080p	да	внутри ChatGPT Plus	художественный кадр

Дальше — без воды: что у каждой реально получается, где они ломаются, и как они складываются в воркфлоу AI-канала вместе с Welder, который сегодня прогоняет основной пайплайн через KIE-прокси на Veo 3.1 и ElevenLabs v3.

Почему этой тройки нет в каждом обзоре

Большинство русскоязычных подборок «нейросетей для видео» пишутся по двум источникам — пресс-релиз OpenAI плюс пресс-релиз Google. Из китайского блока туда стабильно попадает только Kling, потому что Kuaishou раньше всех в 2024-м выложил публичную веб-приёмку и завирусился через Twitter/X.

Wan / Vidu / Hailuo живут в другом дистрибуционном слое — это API-first продукты, которые сначала уходят на WaveSpeed, fal.ai, Replicate, Freepik и Alibaba Cloud, и только потом получают свои веб-приёмки. Креатор без подписки на хотя бы один из агрегаторов их просто не видит. Плюс маркетинг — на английском, документация — половина на китайском, а блог-посты-обзоры выходят с задержкой 1–3 месяца после релиза.

Цифры, которые стоит запомнить, прежде чем читать дальше:

В апреле 2026 Alibaba Cloud зашёл в ShengShu (создатель Vidu) с раундом 2 млрд юаней (~$290M) — это не команда из 5 человек.
ByteDance Seedance 2.0 (февраль 2026) и Alibaba ATH HappyHorse-1.0 (апрель 2026) уже занимают первые две строки Artificial Analysis. Vidu Q3 Pro и Wan 2.5 Preview — в первой десятке.
MiniMax Hailuo 02 обошёл Veo 3 в слепом голосовании на Artificial Analysis по итогам осени 2025; 2.3 — итерация поверх той же базы.

Сейчас по существу.

Wan 2.5 — multi-shot и звук от Alibaba

Wan 2.5 от Alibaba (через WaveSpeed AI и Atlas Cloud) — единственная из тройки, кто из коробки делает несколько связанных шотов с единым героем и согласованным освещением. Это убирает один из главных болевых пунктов Veo 3.1 для AI-Shorts: «сделать 3 шота одной сцены, чтобы лицо персонажа не плыло».

Что фактически умеет:

Длина клипа 5–10 секунд, 24 fps, разрешения 480p / 720p / 1080p; нативное 4К Alibaba обещают в Q1 2026 (по их собственной странице на WaveSpeed).
A/V sync — модель кладёт диалог, ambient и SFX внутрь одного генерации, без отдельного TTS-прохода.
Image-to-video и text-to-video оба поддержаны. Image-to-video стабильно лучше при сложной композиции.
Доступ: WaveSpeed AI (wavespeed.ai/landing/wan-2.5), Alibaba Model Studio (alibabacloud.com/help/en/model-studio/use-video-generation), Atlas Cloud, KIE.ai (kie.ai/wan-2-5), Freepik.

Слабые места, на которые жалуются те, кто гоняет Wan боевыми сериями:

A/V sync на русском уже работает, но мимика губ часто отстаёт от слов на 80–120 мс — для информационного канала ок, для talking-head в кадре заметно.
Контекст сцены ломается, когда вы пытаетесь скормить ему промпт длиннее 350 символов — он либо игнорирует половину, либо превращает её в декорацию.
4К сейчас работает только в preview на отдельных эндпойнтах; в проде получите 1080p апскейлом.

Лучшая ниша для Wan 2.5 в стеке AI-канала — короткий брендовый клип на 2–4 шота (например, «продукт → рука → крупный план → подпись»), где Veo 3.1 заставлял бы вас рендерить три отдельных клипа и сшивать их вручную через ffmpeg. На цене это даёт экономию ≈30–40% относительно Veo при близком визуальном качестве, если сцена не требует RU lip-sync.

Vidu Q3 Pro — 16 секунд непрерывного видео со звуком

ShengShu выпустила Vidu Q3 Pro в январе 2026, и главная цифра здесь одна: 16 секунд видео и звука в одной генерации. Veo 3.1 даёт 8 секунд, Sora 2 — до 20, но дороже и медленнее. Hailuo 2.3 — 10. Kling 3.0 — до 15 в Pro-тарифе, но без нативного звука.

16 секунд — это не просто «в два раза больше Veo». Это другой класс контента:

Один tutorial-кусок на 16 секунд = ~32 слова русского текста, что хватает на 2 законченных шага рецепта или 1 законченный мини-кейс. Vidu закрывает целые слоты, которые в Veo требуют 2 склейки и борьбы с continuity.
Опросы Artificial Analysis блайнд-тестов: Vidu Q3 Pro стабильно в топ-10 по итогам зимы 2026, выше Pika 2.0 и Luma Ray2 при сравнимой цене.
Цена на WaveSpeed AI и Atlas Cloud колеблется около $0.06/секунду в 1080p; то есть 16-секундный клип стоит ≈$1.0, против ≈$1.0 за 8 секунд Veo 3.1 — буквально в два раза дешевле на секунду.

Что у Vidu плохо:

Слабый character consistency в text-to-video — если вы хотите вернуть того же героя через 2 клипа, начинайте с image-to-video и фиксируйте кадр.
Эмоциональная гамма беднее, чем у Hailuo 2.3 — модель легко превращает «грусть» в «нейтральное лицо».
Документация ShengShu тяготеет к китайскому, английская версия местами устаревает; через WaveSpeed и Alibaba Cloud работать проще, чем через прямой API.

Для AI-канала Vidu Q3 Pro полезен в трёх ситуациях: длинные кадры процесса (готовка, сборка, тренировка), 16-секундный hook + промежуточный кадр без склейки, и tutorial-фрагменты, где Veo раньше требовал 2 рендера + кросс-фейд.

Hailuo 2.3 — физика и Media Agent

Hailuo 2.3 (28 октября 2025, MiniMax) — это итерация поверх Hailuo 02, который обошёл Veo 3 в слепом голосовании Artificial Analysis по итогам осени 2025. 2.3 добавляет три вещи: лучшую физику тела (акробатика, ткани, жидкости), стилизацию (аниме, тушь, игровая CG), и live-action микро-мимику. Сверху едет Media Agent, который сам выбирает между 2.3 и 2.3 Fast по сложности промпта и параллельно дёргает image / music / audio модели.

Цены и форматы (через fal.ai):

768p / 6 с — около $0.27 / клип
768p / 10 с — около $0.45 / клип
1080p / 6 с — около $0.28 / клип
1080p / 10 с — около $0.49 / клип
Per-second 768p ≈ $0.045/с, 512p ≈ $0.017/с

То есть «полный 1080p × 10 секунд» стоит в 5–10 раз меньше, чем эквивалент Sora 2 через ChatGPT Plus (если считать по эквивалентному числу секунд / лимиту), и сопоставимо с Veo 3.1 при заметно лучшей физике.

Что у Hailuo лучше всех:

Сложные физические сцены: танцы, акробатика, удары в боксе, разбивающиеся объекты. На Veo 3.1 половина таких сцен «телепортируется» — у Hailuo персонаж завершает движение.
Микро-мимика: подмигивание, лёгкое поднятие брови, дрожание уголка губ. Для эзотерики, психологии отношений, true-crime каналов это ×1.5–×2 retention.
Аниме и иллюстративные стили — ниша, в которой Veo 3.1 проигрывает почти всегда.

Слабые места:

Lip-sync RU — есть, но слабее, чем у Veo 3.1 через KIE; для talking-head в RU я по-прежнему рекомендую Veo.
Media Agent — удобно для R&D, но в проде вы хотите детерминированный выбор модели, иначе биллинг скачет.
Доступ из РФ — без VPN веб-приёмка работает не у всех; стабильнее через fal.ai с зарубежной картой или через WaveSpeed.

Где встроить эту тройку в воркфлоу AI-канала

Если у вас уже работающий стек на Welder (KIE → Veo 3.1 → ElevenLabs v3 → авто-постинг в TikTok / YT Shorts / Reels), вы не выкидываете его ради китайцев. Вы добавляете специализированные слоты:

Multi-shot бренд-вставка раз в неделю — Wan 2.5. Один промпт = 3 связанных шота с heroом. На отдельной серии или брендовом канале это убирает ручную сборку. Cost: ≈$0.8–1.2 за вставку.
Длинный tutorial-кадр — Vidu Q3 Pro. Один 16-секундный кусок там, где раньше шёл Veo 3.1 × 2 + кросс-фейд. Экономия на рендере и на монтажном времени.
Физика и микро-мимика — Hailuo 2.3. Эзотерика, true crime, психология, спорт — всё, где мимика и физика делают retention. На обычном faceless-канале это будет 20–30% хуков и реакций, остальное по-прежнему рендерит Veo.
RU lip-sync и talking-head — оставайтесь на Veo 3.1 через Welder. Базовый пайплайн именно для русского голоса в кадре. Welder здесь не модель, а оркестратор: сценарий → раскадровка → KIE → озвучка → монтаж → автопост.

Если вы только запускаетесь и не хотите выбирать вручную — берите Welder в режиме voiceover и не трогайте видеомодели вообще: на TikTok и Reels в 2026 voiceover-shorts по retention не уступают Veo-роликам в 70% ниш, а себестоимость серии стартует от 290 ₽.

Сравнение себестоимости короткого ролика (15 секунд готового видео из 2–3 шотов):

Сборка	Что внутри	Себестоимость секунды	За ролик 15 с	RU lip-sync
Veo 3.1 через Welder	KIE proxy, ElevenLabs v3, авто-сборка	≈₽9–12	≈₽135–180	✅
Wan 2.5 + ручная сборка	WaveSpeed Wan 2.5, ElevenLabs, ffmpeg вручную	≈₽7	≈₽105	⚠️ слабее
Vidu Q3 Pro × 1 шот 16с	WaveSpeed Vidu, нативный звук	≈₽5–6	≈₽75–90	⚠️ EN-first
Hailuo 2.3 + ручная сборка	fal.ai Hailuo, ElevenLabs, ffmpeg	≈₽6–8	≈₽90–120	⚠️ слабее
Sora 2 через ChatGPT Plus	подписка $20, лимит ~25 видео/мес	≈₽40–80 на секунду в среднем	≈₽600+	⚠️ EN-first

Цифры на 8 июня 2026, курс ₽78 за $1. Welder + Veo 3.1 проигрывают по чистой цене секунды Wan и Vidu, но выигрывают по полному циклу (сценарий → рендер → озвучка RU → автопост) — за счёт того, что у вас нет ручной сборки. Когда время инженера дороже, чем $5/секунду экономии, цена секунды перестаёт быть главным критерием. Подробный разбор юнит-экономики секунды есть в материале цена секунды AI-видео 2026.

Доступ из РФ: 4 рабочих пути в июне 2026

Стандартное условие в РФ — нет российской карты в Stripe, фильтрация прямой регистрации на части китайских веб-приёмок. Что реально работает:

WaveSpeed AI — агрегатор Wan / Vidu / Hailuo / Kling / Seedance, принимает оплату через Stripe (нужна зарубежная карта или Wise/Revolut), API одинаковый для всех моделей. На сегодня — самый чистый способ для разработчика.
fal.ai — основной API-хаб для Hailuo 2.3 и Wan 2.5, прозрачные ставки за секунду, оплата картой; для тех, кто хочет встроить рендер в свой бэкенд.
Atlas Cloud — реселлер с unified-API: Wan 2.5, Hailuo 02 / 02 Pro, Vidu Q3 Pro в одном SDK; полезно, если не хочется писать клиент под каждый китайский эндпойнт отдельно.
Прокладки для веб-подписки — Oplatim, ПиплБот и подобные сервисы оплачивают зарубежную подписку (Kling, Hailuo Pro, Vidu Pro) рублями через СБП за комиссию ≈₽300–500. Активация подписки 15–60 минут; см. свежие гайды на DTF и vc.ru, например vc.ru: как оплатить Kling AI из России в 2026.

Отдельно для тех, кто хочет просто видео на русском без танцев с API и прокладками — стек Welder поверх KIE на Veo 3.1 принимает рубли через ЮKassa с тарифом Starter ₽990 в месяц после редизайна цен в iter-433, и закрывает русский рынок без VPN; подробности в тарифах и на лендинге Sora 2 в Telegram без VPN и карты РФ, где собраны альтернативы для тех, кому именно «без VPN» критично.

Что собирать к лету 2026 — и где начать

Честный ответ: в 2026 никто не сидит на одной модели. Sora 2 закрывается в сентябре, Veo 3.1 дорогая, Kling 3 — отдельная подписка с прокладкой, китайская тройка дешевле, но требует ручной сборки. Реальный продакшен AI-канала — это оркестратор плюс 2–3 модели под разные слоты.

Конкретный набор для соло-креатора на конец Q2 2026:

База — Welder на Veo 3.1 для всех типовых faceless-роликов с RU-голосом. Подписка от ₽990/мес, без VPN, без зарубежной карты.
Слот «брендовый ролик с несколькими шотами» — Wan 2.5 через WaveSpeed. Ставите раз в неделю.
Слот «длинный кадр со звуком 16 с» — Vidu Q3 Pro для tutorial / how-to ниш.
Слот «физика и микро-мимика» — Hailuo 2.3 для эзотерики, true crime, спорта, аниме.
Резерв на talking-head с RU lip-sync — Veo 3.1 остаётся стандартом.

Для агентства / контентной фабрики прибавьте подписку на fal.ai или Atlas Cloud для unified-биллинга и поднимите rate-limiter, чтобы не упереться в лимиты китайских моделей на пике серии. План миграции, если вы пришли с Sora 2, лежит в материале миграция AI-канала с Sora 2 на Veo, Kling и Hailuo.

Не выбирайте «лучшую модель 2026» в теории. Соберите за сегодняшний вечер три ролика по 15 секунд, по одному на стек: Veo 3.1 через Welder, Wan 2.5 через WaveSpeed, Hailuo 2.3 через fal.ai. Посмотрите retention на TikTok через 24 часа. Цифра, которую вы получите за один вечер, перебьёт любой обзор, включая этот.

Если у вас нет Welder-аккаунта — заведите его сейчас и поставьте первую серию voiceover-роликов на автопостинг сегодня вечером: перейти в дашборд. За тариф Starter ₽990 вы получите рабочую базу, поверх которой удобно подключать Wan, Vidu и Hailuo как дополнительные слоты, а не как замену.