Сколько стоит ваш AI?

Выберите сценарий — покажем реальные цены
Кэширование промптов Кэшируйте стабильные части промпта (системные инструкции, few-shot примеры). Кэшированный вход на 90% дешевле.
0%
Кэшируйте повторяющиеся префиксы — экономия до 90% на вводе
Batch API Отправка запросов пакетом, результат в течение 24ч. Скидка 50% на все токены. Для аналитики, генерации контента, пакетной обработки.
Выкл
Несрочные задачи через Batch API — скидка 50% на всё
Роутинг моделей Простые запросы → дешёвая модель, сложные → премиум. Классификатор решает автоматически. Экономия 50-80%.
0%
Простые запросы автоматически на дешёвую модель
Обрезка контекста Сокращение входных данных: суммаризация истории чата, удаление дублей, RAG-чанки вместо полных документов.
0%
Обрезка контекста снижает расход токенов на ~30%
Текущая стоимость $0/мес
Оптимизировано $0/мес
$0
Экономия
Сейчас $0
После $0
Экономия $0
Задача
Уровень
Провайдер
Провайдер Модель Input $/M Output $/M Кэш $/M В месяц Контекст Тир

Часто задаваемые вопросы

Как рассчитывается стоимость запроса?

Стоимость = (входные токены × цена ввода + выходные токены × цена вывода) / 1 000 000. Цены указаны за миллион токенов (MTok). Например, Claude Sonnet 4.6 при 1 000 входных + 500 выходных токенов обойдётся в $0,003 + $0,0075 = $0,0105 за запрос.

Что такое токены и как они соотносятся со словами?

Токены — единицы, которые обрабатывают LLM. В среднем 1 русское слово ≈ 2–3 токена, 1 английское ≈ 1,3 токена. Документ на 1 000 слов — это примерно 1 300–3 000 токенов. Код обычно расходует больше токенов на символ, чем обычный текст.

Какая модель самая дешёвая для кодинга?

DeepSeek V3.2 ($0,28/$0,42 за MTok) и Mistral Small 3.2 ($0,06/$0,18) — лучшее соотношение цена/качество для кода. Для сложной архитектуры Claude Opus 4.6 или GPT-5.4 дают лучший результат, но дороже. Используйте пресет «Код-ассистент» для сравнения.

Что такое кэширование промптов и сколько оно экономит?

Кэширование сохраняет стабильные префиксы промптов (системные инструкции, few-shot примеры), чтобы не отправлять их каждый раз. Кэшированный ввод стоит на 90% дешевле. Если 60% ввода кэшируется — экономия ~54% на входных токенах. Расчёт — на вкладке «Оптимизатор».

Что такое Batch API и когда его использовать?

Batch API позволяет отправлять запросы пакетом и получать результаты в течение 24 часов со скидкой 50% на все токены. Идеально для аналитики, генерации контента, обработки данных — любых задач, не требующих ответа в реальном времени.

Насколько точны эти цены?

Цены берутся напрямую с официальных страниц провайдеров (Anthropic, OpenAI, Google, DeepSeek, Mistral, Meta*, xAI, Amazon) и регулярно обновляются. Все расчёты выполняются локально в браузере — данные не отправляются на сервер.

Что такое роутинг моделей и как он снижает расходы?

Роутинг направляет простые запросы на дешёвую модель (например, GPT-4.1 Nano), а сложные — на премиум (например, Claude Opus). Маленький классификатор решает за каждый запрос. Экономия 50–80% с минимальной потерей качества на смешанных нагрузках.

Как выбрать между топовыми, оптимальными и бюджетными моделями?

Топовые модели (Claude Opus 4.6, GPT-5.4, Gemini 2.5 Pro, Grok 4) дают лучшее качество для сложных задач. Оптимальные (Claude Sonnet 4.6, GPT-5, Mistral Large 3) — баланс цены и качества. Бюджетные (Haiku, GPT-5 Mini, Flash, DeepSeek) — для массовых простых задач, где скорость важнее нюансов.

Цены обновлены: . Источники: официальные страницы провайдеров.