25.03.2026 13:29:13
Я ужасный скептик. Выполнил проверки:
* Проверил, что endpoint вообще жив и токен принимается
* Проверил, что ключ умеет делать реальный inference
* Проверил, что модели действительно те самые
* Проверил, негативный сценарий
* Проверил, как он ведёт себя на чуть более длинном запросе
* Проверил, что endpoint не ломается на 5-10 последовательных запросах
Одно НО:
Cтранные usage/token counts
*на одном запросе:input_tokens: 3
*но при этом cache_creation_input_tokens: 410
На серии коротких запросов:
* input_tokens: 2060
* при том что промпт микроскопический: Reply with exactly: RUN-$i
Это ненормально для такого простого запроса, но с высокой вероятностью это gateway.
Покупал тестовый вариант на 1 день. Пока все нравится. Собираюсь купить еще. Спасибо)
PS
Я бы скрины прикрепил, но форма не поддерживает.