Veo 3.1 Lite vs Fast vs Standard: выбор тарифа 2026

Тест на 12 промптах: где экономить ₽36 за клип, а где платить $6 за качество и звук — выбор тарифа Veo 3.1 для AI-Shorts.

Главное за 30 секунд

В мае 2026 у Google три тарифа Veo 3.1: Lite за $0.05/сек на 720p, Fast за $0.15/сек на 720p–4K и Standard за $0.50–$0.75/сек на 1080p со звуком. Разница в цене — 10–15× между крайностями. Разница в качестве — далеко не 10×.

Lite вышел в апреле 2026, через неделю после того, как OpenAI закрыла потребительское приложение Sora 2 — 26 апреля. Это не совпадение: Google срезала цену вдвое в момент, когда главный конкурент уходит с рынка для creators.

Дальше — где экономить, где платить за качество, и какой тариф зашит в пайплайн Welder по умолчанию.

Что это вообще за «тарифы»

Veo 3.1 — это не одна модель, а семейство из трёх. У них общий тренировочный костяк, но разная плотность параметров и разная пост-обработка. Грубо:

Standard — флагман: 1080p, синхронный звук, лучшее следование промпту.
Fast — облегчённая версия: те же 1080p (плюс опционально 4K через апскейл), звук есть, скорость в 3–4× выше Standard.
Lite — бюджетная: 720p по умолчанию (1080p только для 8-секундных клипов), звука нет, нет ссылочного изображения и продления видео.

Все три доступны через Vertex AI и Gemini API. В потребительских планах Google AI Ultra/Pro сидит Standard плюс ограниченный Fast.

Lite — это первая модель в линейке Veo без звука, и это сделано осознанно: значительная часть стоимости инференса уходит на аудио-генерацию. Поэтому Google смогла срезать цену в 10× и оставить картинку на приемлемом уровне.

Цены в одной таблице

Пересчёт на 8-секундный вертикальный клип, тариф Vertex AI на май 2026, курс ≈ 90 ₽/$:

Тариф	$/сек	8 сек, $	8 сек, ₽	Разрешение	Звук	4K	Reference image
Veo 3.1 Lite (720p)	$0.05	$0.40	~36 ₽	720p	нет	нет	нет
Veo 3.1 Lite (1080p)	$0.08	$0.64	~58 ₽	1080p (только 8 сек)	нет	нет	нет
Veo 3.1 Fast	$0.15	$1.20	~108 ₽	720p / 1080p / 4K	да	да	да
Veo 3.1 Standard (без аудио)	$0.50	$4.00	~360 ₽	1080p	нет	нет	да
Veo 3.1 Standard (со звуком)	$0.75	$6.00	~540 ₽	1080p	да	нет	да

Для сравнения — другие лидеры 2026 года на той же длительности:

Модель	$/сек	8 сек, $	Звук
Kling 3.0 Standard (fal.ai)	$0.084	$0.67	нет
Kling 3.0 Pro (fal.ai)	$0.112	$0.90	нет
Hailuo 02 Standard 768p	$0.045	$0.36	нет
Runway Gen-4.5 (Standard план)	≈$0.10	$0.80	в бандле через Aleph
Sora 2 API (до 24.09.2026)	$0.30	$2.40	да

Hailuo 02 формально дешевле Lite, но за это вы платите отсутствием звука, разрешением 768p и заметными артефактами на движении камеры. Lite в 1080p за $0.08/сек — на текущей карте рынка лучший баланс «цена / частота промпт-фейлов».

Когда брать Standard

Standard — инструмент для тех 10–15% сцен в ролике, которые несут смысл. Открывающий план, эмоциональный крупный план персонажа, сцена с диалогом, любой кадр с явной физикой (вода, ткань, осколки).

Плюсы, которые видны в тестах:

Лучший lip-sync. В прямом сравнении Veo 3.1 vs Sora 2 на бенчмарке MovieGenBench (1003 промпта) Veo 3.1 лидирует в синхронизации голоса и губ.
Минимум промпт-фейлов. Standard честно отрабатывает камеру, освещение, направление взгляда. Fast эти параметры размывает в каждом третьем-четвёртом запросе.
Полный звуковой ландшафт. Не просто речь, а ambient: шаги, ветер, моторы, эхо помещения.

Когда не оправдан:

Faceless-контент без диалогов. Lip-sync не нужен — переплата чистая.
Серийный батч-пайплайн. На 100 клипов в день Standard превращается в $400–600 в сутки. Это математика канала-миллионника, не старта.
Картинки для обложек или превью. Берёте Lite или вообще image-генератор.

Грубый ориентир: если за смену нужно сделать ≤10 значимых сцен — Standard. Больше — переключайтесь.

Когда брать Fast

Fast — рабочий тариф. Эта модель будет крутиться на бэкенде у 80% AI-каналов 2026 года, потому что:

Качество звука в большинстве сцен неотличимо от Standard. В слепом A/B на 12 коротких сценах разница ловится только на сложной речи (шёпот, акцент, эмоция выше нейтральной).
Картинка — те же 1080p, опционально 4K через встроенный апскейл (Vertex AI добавила его в марте 2026).
В 3–4× быстрее Standard на инференс — для батча это значит ждать 40 секунд, а не 2 минуты.
$1.20 за 8-секундный клип со звуком против $6 — пятикратная экономия без видимого ущерба.

Где Fast подведёт:

Сложные многоплановые сцены с несколькими персонажами в кадре. Прокидывает позы.
Промпты с точной композицией («тёплый янтарный свет, 35-мм объектив»). Fast чаще игнорирует второстепенные параметры.
Сцены с тонкой мимикой. Если шорт держится на лице — Standard выигрывает заметно.

В пайплайне Welder Fast — дефолт. Это сознательный выбор: Welder использует Veo 3.1 Fast по умолчанию и подменяет на Veo 3.1 Standard только для сцен, помеченных как ключевые в сценарии. Стартовый тариф от 290 ₽ за серию на 8–10 клипов окупается только при такой схеме. Подробнее про эту экономику — в смете запуска ИИ-канала 2026.

Когда брать Lite

Lite — для объёма. Инструмент для тех частей пайплайна, где нужен кадр, а не сцена:

B-roll и закадровые планы. Облака, текстуры, абстрактные переходы, заставки.
Faceless-контент без озвучки в кадре. Голос даёте отдельно — через ElevenLabs v3 или OpenAI Voice TTS. Картинка из Lite, аудио поверх в монтаже.
Прототипирование сценария. Прежде чем тратить $6 на финальный Standard-клип, погоняйте промпт в Lite за $0.40 — увидите, ловит ли модель композицию.
Локализация под разные платформы. Один сценарий → горизонталь для YouTube, вертикаль для TikTok, квадрат для Instagram Feed. Три прохода Lite дешевле одного Standard.

Чего ждать не стоит:

Звука. Это аппаратное ограничение тарифа, не баг.
Длинных сцен. 1080p доступен только для 8-секундных клипов; 4 и 6 секунд — это 720p.
Ссылочных изображений (reference image). Если нужно протащить конкретное лицо через серию кадров, Lite не подойдёт — берите Fast или смотрите гайд по консистентному персонажу.

Один из пяти Shorts, которые YouTube подсовывает новому пользователю, — это AI-контент по данным CEO YouTube за январь 2026. Платформы режут в охватах 30–45% низкокачественных AI-роликов. Lite-only пайплайн без работы со звуком и сценарием попадает в эту категорию первым. Не делайте каналы из чистого Lite.

Прямое сравнение трёх тарифов: 12 промптов

Мы прогнали один и тот же набор из 12 промптов через все три тарифа. Выборка под Shorts-формат: 1080p вертикаль, 8 секунд, разный жанр — диалог, b-roll, движение камеры, абстракт, фотореализм.

Параметр	Lite	Fast	Standard
Цена за прогон	$4.80	$14.40	$72.00
Время рендера (avg)	42 сек	58 сек	3 мин 40 сек
Промпт-фейлы (полная пересдача)	4 из 12	2 из 12	0 из 12
Звук в финальном клипе	—	да	да
Артефакты на быстром движении	заметные в 5/12	мелкие в 2/12	нет
Lip-sync на диалогах	—	нормально	отлично

Что отсюда вычитывается:

Standard окупается на сложных промптах. 0 фейлов против 4 у Lite — на цикле из 100 клипов это +33% реальной выработки, не теоретической.
Fast — золотая середина по «цена / частота фейлов». Два фейла на 12 — это <17%, приемлемо для серийного канала.
Lite — для bulk, не для финала. 4 фейла из 12 — это 33% переделок. С учётом цены всё равно дешевле Fast, но если каждый промпт стоит креативного усилия — себя не оправдает.

Sora 2, Kling 3.0, Runway Gen-4.5: где Veo 3.1 не догоняет

Veo 3.1 — лидер в звуке и общем preference на бенчмарке. Но рынок 2026 года многополярный, и в трёх местах конкуренты впереди.

Sora 2 (API до 24 сентября 2026) — пока API живёт, у Sora лучшая физика и работа камеры. Если в нише важна сцена с реальной механикой (взрывы, столкновения, жидкости) — Sora 2 даст более убедительный результат, чем Veo 3.1 Standard. Минус: вы строите процесс на платформе, которая официально закрывается через 4 месяца. Sora уходит, потому что приложение тратило около $1M в день на инференс при общем доходе $2.1M за весь срок жизни. Если вы только сейчас выбираете стек — игнорируйте Sora и смотрите план миграции на Veo 3.1.

Runway Gen-4.5 — лидер по семантическому пониманию метафор и единственный, кто умеет генерить мультишот-сцену длиной до 60 секунд в одном проходе (релиз декабря 2025). За $12/мес в плане Standard вы получаете Gen-4.5, Veo 3.1 и Kling 3.0 в одной подписке — сильное предложение, если делаете гибридный пайплайн.

Kling 3.0 — китайская модель Kuaishou, силён в движении персонажей и анимешных стилях. Кадр-в-кадр с Veo 3.1 Fast на live-action проигрывает, но на стилизованном контенте часто берёт верх. Цена через fal.ai сопоставима с Veo 3.1 Fast.

Welder, в свою очередь, не пытается быть моделью — это пайплайн поверх Veo 3.1 Fast/Standard с RU-сценаристом, ElevenLabs v3 и автоматической нарезкой под TikTok, Reels, Shorts и VK Клипы. То есть Welder выбирает за вас тариф по контексту сценария. Это удобно, когда не хочется вручную решать, какая сцена идёт в Standard, какая — в Fast.

Как тариф меняет экономику AI-канала

Соберём грубый бюджет на 100 коротких видео в месяц — типичный объём растущего faceless-канала:

Тариф	Цена 100×8-сек клипов	Звук	Доп. расходы
Lite 720p only	~$40	внешний	+$20 ElevenLabs + время монтажа
Lite 1080p only	~$64	внешний	+$20 ElevenLabs
Fast (mixed audio)	~$120	в кадре	минимум
Standard со звуком	~$600	в кадре	минимум
Mixed (80% Fast / 20% Standard)	~$216	в кадре	минимум

В реальном пайплайне последняя строка — целевая структура для серийного канала. Lite перекрывает b-roll и второстепенные сцены, Standard добавляется только в открывающие планы и сцены с диалогом.

На 100 клипах разница между «100% Standard» и «80/20 mixed» — это $384 в месяц, то есть полная окупаемость рабочего канала на YouTube Shorts с RPM $0.5–1.5.

Подробнее про юнит-экономику инференса в цене секунды AI-видео 2026.

Чек-лист: какой тариф под вашу задачу

Открывающая сцена с эмоциональным крупным планом и репликой → Standard со звуком.

Сцена с диалогом, lip-sync критичен → Standard.

Серийный faceless-контент, голос за кадром, 60–80% сцен в ролике → Fast.

B-roll, переходы, заставки, текстуры → Lite 720p.

Сцены для горизонтального YouTube или CTV с 1080p → Lite 1080p (только 8-сек) или Fast.

Прототипирование промпта перед финалом → Lite на 4–6 сек.

Сцена с реальной физикой (вода, осколки, столкновение) до 24 сентября 2026 → Sora 2 API, после — Veo 3.1 Standard.

Длинный мультишот в одном проходе (>30 сек) → Runway Gen-4.5, потом дочистить в Veo.

Стилизованный контент, аниме-вайб, движение персонажей → Kling 3.0 + lip-sync в Hedra или Sync.

Лень разбираться с тарифами вручную → Welder подберёт тариф по сценарию автоматически и соберёт ролик целиком.

Что в итоге выбрать в мае 2026

Берите Fast как дефолт. Это самая нерискованная гипотеза: качество держит уровень, цена позволяет батч-пайплайн, звук на месте.

Lite добавьте в пайплайн как второй уровень для всего, что не несёт лицо и реплику. Это не основной инструмент, а способ выжать в 3× больше контента из того же бюджета.

Standard — точечное оружие. Откройте лимит на 10–15% сцен, которые работают на удержание зрителя в первые 3 секунды и в кульминации.

И не стройте процесс на Sora 2: 24 сентября 2026 API уйдёт, и придётся переносить пайплайн под аврал. Лучше встаньте на Veo 3.1 сейчас.

Запустить серию на Veo 3.1

Welder выбирает тариф по контексту сцены — Fast по умолчанию, Standard для ключевых, Lite для b-roll. От вас — ниша, голос и сценарная заявка; от системы — 8–10 готовых вертикальных клипов под TikTok, Reels, Shorts и VK Клипы.

Сделать первое видео →

Источники: Google Cloud Blog (Veo 3.1 Lite на Vertex AI, 04.2026), OpenAI Help Center (Sora discontinuation, 03.2026), MindStudio Veo 3.1 tier comparison, The Decoder (Sora shutdown timeline), MovieGenBench public results, январское письмо CEO YouTube о AI-контенте.