Перейти к содержимомуAPI-война июнь 2026: цена AI-Shorts упала на 60% за год
WWelder AI

API-война июнь 2026: цена AI-Shorts упала на 60% за год

Тренды10 минWelder AI

API-война июнь 2026: цена AI-Shorts упала на 60% за год

−60–80% к LLM, −89% к Veo 3.1 Lite, sunset Sora 2 и tokenizer Opus 4.7 — как пересобрать стек AI-канала под июнь 2026

Главное за 30 секунд

Между маем 2025-го и июнем 2026-го фронтир-LLM в API-стеке для AI-Shorts подешевели на 60–80% по числам OpenAI, Anthropic и Google. Claude Opus 4.7 ($5/$25 за 1М токенов) стоит сегодня примерно в шесть раз меньше, чем Opus 4.0 год назад. Veo 3.1 Lite за $0.05/сек — это 4 ₽ за секунду 1080p без аудио. Sora 2 — $0.10/сек, но OpenAI закрывает её API 24 сентября 2026.

В пересчёте на одну вертикалку 30 секунд + озвучка + субтитры: год назад полный пайплайн стоил ₽180–240 в чистом API; сейчас тот же ролик обходится в ₽60–90. 1000 Shorts в месяц — это ₽60–90K чистого API против ₽180–240K год назад. Дальше — куда уходят эти ₽120K разницы, какую модель ставить на каждый шаг пайплайна и почему оптимизация по цене ломается, если не учесть sunset Sora 2, Enterprise-only Runway и квоты Veo на Vertex.

Почему цена упала: рынок не один, а четыре

Падение цен в 2025–2026 — это не «AI стал дешевле». Это четыре разных рынка, которые сложились в один счёт.

Текстовые модели (LLM). Anthropic за год скинула Opus с $15/$75 до $5/$25 за 1М токенов — это −66% по входу и −66% по выходу. OpenAI на GPT-5.4 урезала входной токен с $5 до $2.50. Google Gemini 3.5 Flash — $1.50/$9, фактически новая «база» для дешёвых сценариев. DeepSeek V4-Pro в мае 2026 сделал перманентное снижение на 75%, базовая ставка теперь $0.0035 за 1М входных токенов. Это значит: генерация сценария AI-Short больше не статья расхода. Если год назад вы платили ₽1.5 за один черновик сценария на Opus, сейчас — ₽0.25 на Gemini 3.5 Flash или ₽0.50 на Opus 4.7.

Видео-модели. Здесь падение тише, но острее в точке. Veo 3 в мае 2025 стоил $0.50/сек, Veo 3.1 Lite в июне 2026 — $0.05/сек на Vertex AI. Это −90% за тот же 8-секундный 1080p-клип. Sora 2 Standard — $0.10/сек, Sora 2 Pro — $0.30/сек. Kling 3.0 — $0.075–$0.112/сек. Hailuo 02 Standard на fal.ai — $0.045/сек на 768p, Pro 1080p — $0.08/сек.

Голос (TTS). ElevenLabs Multilingual V1/V2 — 1 кредит на символ, V2.5 Flash — 0.5–1 кредит. Overage сейчас ≈ $0.30 за 1000 символов. Голос — единственная статья, где цена за единицу почти не сдвинулась за год; но появились новые игроки (OpenAI Voice realtime, Yandex SaluteSpeech, Sber), которые сбивают рынок снизу для рунет-каналов.

Постпродакшен. Это рынок, где API-цены вообще не падают — Submagic, CapCut Pro, Captions.ai остаются на subscription-модели. Но они и не растут, потому что бесплатные альтернативы (CapCut free + встроенные субтитры) забирают long tail.

Из этих четырёх рынков самый чистый сигнал — LLM. Прайс-кривая видео-моделей зависит от того, на чьём железе вы крутитесь: Vertex AI квотирует Veo, OpenAI закрывает Sora 2, Runway с января 2026 убрала Gen-4 API в Enterprise ($800/мес за 5 seats минимум). State of AI-video H1 2026 — это тот же сюжет, но через 7 рыночных сдвигов; здесь же мы сидим только на ценах.

Себестоимость одной AI-Short: математика июня 2026

Возьмём типичный voiceover-Short: 30 секунд, идея → сценарий (≈600 символов RU) → 10 кадров (still images) → озвучка → субтитры → сборка ffmpeg. Это «дешёвая» сторона пайплайна. Цены при прямом API без надстроек:

ЭтапГод назад (май 2025)Сейчас (июнь 2026)Δ
Сценарий (1 черновик + 2 ревизии)₽4.5 (Opus 4.0, ~6K токенов)₽1.8 (Opus 4.7) или ₽0.6 (Gemini 3.5 Flash)−60–87%
10 кадров (still images, Flux/SDXL)₽9 ($0.10)₽4.5 ($0.05)−50%
TTS RU 600 символов (ElevenLabs Multi)₽16₽160%
Субтитры (Whisper или встроенные)₽1.5₽0.5−67%
Сборка (ffmpeg, serverless)₽3₽30%
Итого voiceover-Short, чистый API≈ ₽34≈ ₽25−26%

Cinematic-пайплайн (видео-модели вместо still+motion) — другая история:

ЭтапМай 2025Июнь 2026
Сценарий + раскадровка₽12₽3
4× 8-секундных клипа Veo 1080p₽1600 (Veo 3, $0.50/сек)₽160 (Veo 3.1 Lite $0.05/сек) или ₽800 (Veo 3.1 Standard $0.40/сек с аудио)
TTS если без аудио-веха модели₽16₽16
Сборка₽3₽3
Итого cinematic, чистый API (Lite)≈ ₽1630≈ ₽180
Итого cinematic, чистый API (Standard+audio)≈ ₽820

−89% себестоимости на cinematic в Lite-тире, −50% на Standard+audio. Voiceover пайплайн дешевле даже сейчас (₽25 против ₽180), но cinematic с Veo 3.1 Lite уже сравним с премиум-voiceover пайплайном на ElevenLabs Pro Voice.

В Welder тарифы привязаны к этой реальности: Starter 990 ₽ — это около 10–30 voiceover-роликов в зависимости от длины, шаг cinematic ×1690/990 ₽. Разница с чистым API — это серверная инфраструктура, retry-логика, ffmpeg-сборка, RU-голоса, очередь, автопостинг, мониторинг падений KIE и обходные пути для квот. Детальная разбивка, какой шаг куда уходит, есть в Cinematic vs voiceover в Welder.

Какую модель ставить на какой шаг

API-война заставляет mix-and-match. Идея «один поставщик на всё» в 2025-м была удобной, в 2026-м — дорогой.

Сценарий (script writer). Если канал серийный, ставка на Gemini 3.5 Flash. $1.50/$9 на 1М, RU-output без явной деградации против Opus на коротких форматах до 600 символов. Бюджет: ₽0.25–0.50 за черновик. Claude Opus 4.7 дорогой ($5/$25), но даёт лучший «голос автора» — оставляйте его на канал, где вы вручную правите тон. GPT-5.5 ($5/$30) хорош в structured output, но Gemini 3.5 Flash догоняет его на JSON-схемах. DeepSeek V4-Pro — для оптовых пайплайнов от 100 Shorts в день: $0.0035–$0.83 за 1М входных токенов, ставит экстремальные цены.

Раскадровка и chunk plan. Gemini 3.5 Flash в 90% случаев. Только сложные narrative-arc-каналы оправдывают Opus 4.7. Здесь, кстати, лежит ловушка: Anthropic ввела новый токенайзер на 4.7, и для RU-входов он даёт на 25–35% больше токенов, чем 4.6. Эффективный счёт за RU-сценарий на Opus 4.7 не упал с $5 до $5, он упал на $5×1.3 = $6.5. Это меньше, чем «−66% от $15», но всё равно около −50%.

Кадр (still / image). Flux Pro 1.1 на fal.ai — ₽4–5 за кадр. SDXL Lightning — ₽1–2. Качество для voiceover-канала отличается на ≤10% — не выкидывайте Flux Pro раньше времени, если у вас есть зрители с большим экраном.

Видео (cinematic). Здесь идёт основная экономия. Veo 3.1 Lite — $0.05/сек на Vertex, дешевле Sora 2 в 2 раза и без sunset-риска. Sora 2 Standard — $0.10/сек, но 24 сентября 2026 API закрывается; миграционный план обязателен. Kling 3.0 — $0.075–$0.112/сек, доступен без VPN-ходов через российские прокси-провайдеры. Hailuo 02 Standard — $0.045/сек на 768p, дешевле всех, но качество явно проигрывает Veo на крупных планах. Runway Gen-4 на API теперь Enterprise-only, $800/мес — фактически выпал из любительского пайплайна.

TTS. ElevenLabs v3 Multilingual для эмоционального канала. OpenAI Voice (TTS-1-HD) — для нейтрального диктора. Yandex SpeechKit и Sber SaluteSpeech — для рунет-канала, где важна юридическая локация серверов; цена в 3–4 раза ниже ElevenLabs.

Постпрод. CapCut Free для индивидуала, Submagic Lite ($16/мес) — если делаете >50 Shorts в месяц с виральными подписями. Captions.ai — для talking-head, в voiceover-каналах избыточен.

ЭтапДешёвый стекПремиум стек
СценарийGemini 3.5 FlashClaude Opus 4.7
РаскадровкаGemini 3.5 FlashGPT-5.5
ВидеоHailuo 02 Standard / Kling 3Veo 3.1 Standard + audio
TTSOpenAI TTS-1-HDElevenLabs v3 Voice ID
СубтитрыCapCut FreeSubmagic Pro
₽/Short, 30 сек voiceover~₽15~₽45
₽/Short, 30 сек cinematic~₽100~₽350

Это таблица для тех, кто строит пайплайн напрямую через API. Цены в текущем тарифе Welder включают сверху серверную сборку, очередь и RU-инфраструктуру; разница с чистым API — это то, чего вы не платите ssh-инженеру.

Подводные камни: где экономия ломается

Картинка с −60% к API — правда только для тех, кто остаётся в безопасной зоне рынка. За периметром лежит ряд ловушек.

Sora 2 sunset — 24 сентября 2026. OpenAI закрывает Sora 2 API под предлогом миграции на Sora 3. Каналы, у которых пайплайн жёстко завязан на Sora 2 prompts, теряют 4 месяца оптимизаций. План миграции (Veo 3.1 → Kling 3 → Hailuo 02) разобран отдельно в миграция с Sora 2; коротко — Veo 3.1 берёт 80% сюжетов 1:1, Kling 3 хорош на динамике, Hailuo доводит длинные кадры.

Runway Enterprise-only с января 2026. Runway Gen-4 API убрали из self-serve. Если ваш пайплайн использовал Gen-4 для motion-control, переезжайте на Pika 2.5 ($8–58/мес) или Kling 3.0 — Pika 2.5 теряет качество на сложных движениях, но в Shorts-формате 9:16 разница теряется.

Квоты Veo на Vertex AI. Google не публикует жёсткие лимиты, но в практике аккаунтов до $500/мес trailing — около 200 клипов в день на Veo 3.1 Standard. Для канала с 30 cinematic-роликами/день этого достаточно; для агентства с 6 каналами нужен второй биллинг-аккаунт или фоллбэк на Kling.

Курс USD/RUB. Все цены выше — в долларе. Если рубль ослабнет с текущих 80 ₽ до 100 ₽, ваша −60% экономия превратится в −20%. Хеджирование — серийная закупка кредитов на годовой период (Anthropic prepaid, Vertex committed-use discounts).

Региональный доступ. Veo и Sora из РФ напрямую недоступны. Нужен либо VPS в правильном регионе, либо прокси-провайдер, либо сервис, который держит инфраструктуру за периметром санкций. 90% самостоятельных сборок ломаются на третьем месяце из-за rotating IP-блоков Google и периодических банов аккаунтов.

Что делать AI-каналу прямо сейчас

Чек-лист на ближайшие 30 дней.

  1. Ревизия API-стек. Пройдите по каждому шагу пайплайна и проверьте, не используете ли вы прошлогодний default. Канал, который год назад поставил Opus 4.0 на сценарий, сейчас переплачивает в шесть раз. Переход на Gemini 3.5 Flash на стадии черновика, Opus 4.7 — на финальной редактуре. Экономия — ₽30–60 в день на серийном канале.
  2. Замените все cinematic-вызовы Veo 3 на Veo 3.1 Lite или Standard. −90% на видео-этапе, если ещё этого не сделали.
  3. Тестируйте Hailuo 02 Standard на 20% серии. Если разница в retention <5%, переводите 50% серии на Hailuo и оставляйте Veo на «киношные» кадры.
  4. Запланируйте миграцию с Sora 2 до 1 сентября 2026 — за 3 недели до sunset поздно, прямо сейчас — нормально.
  5. Серийный канал (10+ Shorts/день) — DeepSeek V4-Pro на брэйнсторм идей. Себестоимость идеи падает до сотых рубля.
  6. Лимиты на Vertex. Чтобы не словить нечаянный $2000 счёт из-за бага в pipeline.
  7. Долларовый риск. Закладывайте 25% подушку в бюджет.

Если канал стоит 30K ₽ в месяц на чистом API сейчас, после ревизии стек реально опуститься до ₽12–18K без потери качества. Для агентства с 6 каналами это разница в ₽80K/мес — зарплата SMM-менеджера.

Ниша канала и RPM в выбранной ставке решают, насколько эта экономия конвертируется в маржу: ниша с RPM $4 терпит дорогой пайплайн, ниша с RPM $0.6 живёт только на самом дешёвом стеке. Перед оптимизацией API проверьте, в какой колонке вы.

Запустить новый стек

API-война — это не разовое событие. Падение цен будет идти ещё минимум 12 месяцев: Anthropic анонсировала Opus 4.8 на 2026Q4, Google готовит Gemini 4 Flash, OpenAI продолжает закрывать дорогие модели и открывать дешёвые. Стратегия «оптимизировать раз в год» больше не работает; стратегия «следить квартально» — да.

Если времени на квартальную оптимизацию API-стека нет, имеет смысл переложить эту работу на сервис, который делает её за вас. Welder под капотом перестраивает provider cascade каждую неделю — когда Veo Lite добавили в апреле, мы перевели туда 60% базовых кадров уже на следующей неделе; когда Anthropic скинула Opus 4.7, мы переписали factory-prompt под новый ценник за 48 часов. Вы платите по тарифу, не по API-биллингу — и не отслеживаете каждое движение OpenAI и Google вручную.

Сделать первый Short на актуальном стеке июня 2026 можно за вечер из дашборда — без VPN, без подписок на Vertex и без миграционных планов на случай sunset Sora 2.

#trends#api#veo-3-1#sora-2#kling-3#claude-opus-4-7#gemini-3-5-flash#welder