Question 1

Как рассчитывается стоимость запроса?

Accepted Answer

Стоимость = (входные токены × цена ввода + выходные токены × цена вывода) / 1 000 000. Цены указаны за миллион токенов (MTok). Например, Claude Sonnet 4.6 при 1 000 входных + 500 выходных токенов: $0,003 + $0,0075 = $0,0105 за запрос.

Question 2

Что такое токены и как они соотносятся со словами?

Accepted Answer

Токены — единицы, которые обрабатывают LLM. 1 русское слово ≈ 2–3 токена, 1 английское ≈ 1,3. Документ на 1 000 слов — примерно 1 300–3 000 токенов. Код расходует больше токенов на символ.

Question 3

Какая модель самая дешёвая для кодинга?

Accepted Answer

DeepSeek V3.2 ($0,28/$0,42 за MTok) и Mistral Small 3.2 ($0,06/$0,18) — лучшее соотношение цена/качество. Для сложной архитектуры Claude Opus 4.6 или GPT-5.4 дают лучший результат.

Question 4

Что такое кэширование промптов и сколько оно экономит?

Accepted Answer

Кэширование сохраняет стабильные префиксы промптов. Кэшированный ввод стоит на 90% дешевле у Anthropic и Google, ~90% у OpenAI. Если 60% ввода кэшируется — экономия ~54% на входных токенах.

Question 5

Что такое Batch API и когда его использовать?

Accepted Answer

Batch API — отправка запросов пакетом с результатами в течение 24 часов и скидкой 50%. Поддерживается у Anthropic, OpenAI, Google и Amazon. Подходит для аналитики, генерации контента, обработки данных.

Question 6

Насколько точны эти цены?

Accepted Answer

Цены берутся с официальных страниц провайдеров и регулярно обновляются. Последнее обновление: март 2026. Все расчёты выполняются локально в браузере — данные не отправляются на сервер.

Question 7

Что такое роутинг моделей и как он снижает расходы?

Accepted Answer

Роутинг направляет простые запросы на дешёвую модель (например, GPT-4.1 Nano за $0,10/MTok), сложные — на премиум (Claude Opus за $5/MTok). Экономия 50–80% с минимальной потерей качества.

Question 8

Как выбрать между топовыми, оптимальными и бюджетными моделями?

Accepted Answer

Топовые (Claude Opus 4.6, GPT-5.4, Gemini 2.5 Pro, Grok 4) — лучшее качество. Оптимальные (Claude Sonnet 4.6, GPT-5, Mistral Large 3) — баланс цены и качества. Бюджетные (Haiku, GPT-5 Mini, Flash, DeepSeek) — для массовых простых задач.

Сколько стоит ваш AI?

Часто задаваемые вопросы