| Провайдер | Модель | Input $/M | Output $/M | Кэш $/M | В месяц | Контекст | Тир |
|---|
* Meta Platforms Inc. признана экстремистской организацией и запрещена на территории РФ.
Стоимость = (входные токены × цена ввода + выходные токены × цена вывода) / 1 000 000. Цены указаны за миллион токенов (MTok). Например, Claude Sonnet 4.6 при 1 000 входных + 500 выходных токенов обойдётся в $0,003 + $0,0075 = $0,0105 за запрос.
Токены — единицы, которые обрабатывают LLM. В среднем 1 русское слово ≈ 2–3 токена, 1 английское ≈ 1,3 токена. Документ на 1 000 слов — это примерно 1 300–3 000 токенов. Код обычно расходует больше токенов на символ, чем обычный текст.
DeepSeek V3.2 ($0,28/$0,42 за MTok) и Mistral Small 3.2 ($0,06/$0,18) — лучшее соотношение цена/качество для кода. Для сложной архитектуры Claude Opus 4.6 или GPT-5.4 дают лучший результат, но дороже. Используйте пресет «Код-ассистент» для сравнения.
Кэширование сохраняет стабильные префиксы промптов (системные инструкции, few-shot примеры), чтобы не отправлять их каждый раз. Кэшированный ввод стоит на 90% дешевле. Если 60% ввода кэшируется — экономия ~54% на входных токенах. Расчёт — на вкладке «Оптимизатор».
Batch API позволяет отправлять запросы пакетом и получать результаты в течение 24 часов со скидкой 50% на все токены. Идеально для аналитики, генерации контента, обработки данных — любых задач, не требующих ответа в реальном времени.
Цены берутся напрямую с официальных страниц провайдеров (Anthropic, OpenAI, Google, DeepSeek, Mistral, Meta*, xAI, Amazon) и регулярно обновляются. Все расчёты выполняются локально в браузере — данные не отправляются на сервер.
Роутинг направляет простые запросы на дешёвую модель (например, GPT-4.1 Nano), а сложные — на премиум (например, Claude Opus). Маленький классификатор решает за каждый запрос. Экономия 50–80% с минимальной потерей качества на смешанных нагрузках.
Топовые модели (Claude Opus 4.6, GPT-5.4, Gemini 2.5 Pro, Grok 4) дают лучшее качество для сложных задач. Оптимальные (Claude Sonnet 4.6, GPT-5, Mistral Large 3) — баланс цены и качества. Бюджетные (Haiku, GPT-5 Mini, Flash, DeepSeek) — для массовых простых задач, где скорость важнее нюансов.
Цены обновлены: . Источники: официальные страницы провайдеров.