Перейти к содержимому

Продукт · Cost & FinOps

Видьте свои расходы на модели, атрибутируйте и управляйте ими

Два модуля в одном месте: декларируемый каталог моделей в вашем парке — их возможности, прейскурантные цены, политика маршрутизации — и представление FinOps, которое раскладывает расход токенов и затрат по модели, поставщику, агенту, сессии, команде и проекту. Задавайте бюджеты и пороги, читайте проекцию по текущему темпу и позвольте бюджетным сигналам управлять разрешением модели. Видеть расходы и управлять ими — а не запускать ваш inference силами Olivares.

В продукте

Дашборд затрат

Настоящий скриншот, демонстрационные данные. Представление для руководства: расходы на текущую дату, проекция по текущему темпу, объём токенов, активные управляемые модели и график динамики затрат — в разбивке, чтобы вы видели, куда уходят деньги.

Реальный скриншот
Дашборд затрат Olivares: итоговые показатели расходов и токенов, проекция по текущему темпу, количество активных управляемых моделей и график динамики затрат во времени, заполненный демонстрационными данными.

Что вы получаете

Два модуля: парк моделей и деньги

Каталог моделей, которыми вы управляете, и политика их разрешения в паре с представлением затрат, которое атрибутирует каждый микродоллар.

Декларируемый каталог моделей

Модели в вашем парке с их возможностями и прейскурантными ценами, управляемые централизованно. Цена — это декларируемый датированный ориентир, который вы редактируете сами: сверяйте его с поставщиком; мы никогда не выдаём его за неизменную истину.

Политика маршрутизации с цепочкой резервирования

Определите, как запрос разрешается в модель — по стоимости, задержке, возможностям или закреплению — с цепочкой резервирования /resolve. Это политика, которая принимает решение; запуск inference — отдельный, явно подготовленный шаг.

Расходы, атрибутированные

Расход токенов и затрат в разбивке по модели, поставщику, агенту, сессии, команде и проекту. Внутри деньги хранятся как целочисленные микро-USD, поэтому итоги сходятся точно. Разбивки по модели и поставщику присутствуют всегда; более тонкая атрибуция зависит от подключённого коннектора.

Бюджеты, способные управлять разрешением

Бюджеты с порогами, оповещениями и рекомендациями. Превышенный бюджет может управлять разрешением модели — блокировать или ограничивать — так что лимиты затрат применяются в точке принятия решения, а не обнаруживаются в счёте.

Что реально

Доступно для того, чтобы видеть расходы и управлять ими — но не для запуска вашего inference

Мы точны в том, что именно означает каждая цифра, потому что от этого зависят финансовые решения:

  • Доступно: чтение, аналитика и бюджетная сигнализация. Расходы по модели, поставщику, агенту, сессии, команде и проекту; бюджеты с порогами, оповещениями и рекомендациями; а также применение бюджета, способное управлять разрешением модели через блокировку или ограничение. Разбивки по модели и поставщику заполнены всегда.
  • Честные пробелы в данных: прейскурантная цена — это декларируемый датированный ориентир, который вы поддерживаете сами: сверьте его с поставщиком, прежде чем на него опираться. Прогноз — это линейная проекция по текущему темпу, а не предсказательная модель. Атрибуция по агенту, сессии и команде может оставаться пустой, пока не подключён коннектор с атрибуцией по сессиям — а усечённый агрегат показывается как частичный, но никогда как точный итог. Мы не выводим из потока затрат величину экономии на кэше, поэтому и не показываем её.
  • Дорожная карта / стык: политика маршрутизации задаётся здесь, но исполнение маршрутизации — шлюз, который фактически вызывает модель, — это отдельный компонент. Model /execute закрыт по умолчанию (deny-closed) и возвращает 503 без явной подготовки. Olivares помогает вам видеть расходы и управлять ими; он не запускает inference за вас.

Cost & FinOps — вопросы

Откуда берутся цены — поступают ли они напрямую от поставщиков?

Нет. Цена в каталоге — это декларируемая прейскурантная цена: датированный ориентир, который вы редактируете и поддерживаете, а не живой канал данных. Он существует для того, чтобы оценки затрат были согласованными, а не чтобы вы воспринимали его как актуальную истину поставщика. Сверьте его с поставщиком, прежде чем принимать на его основе решение.

Является ли прогноз предсказанием того, сколько мы потратим?

Это линейная проекция по текущему темпу — она продлевает ваш нынешний темп расходов вперёд, не более того. Это не предсказательная модель, и она не учитывает сезонность, запланированные изменения или то, что вы ещё не сделали. Читайте её так: «если ничего не изменится, такова траектория».

Почему часть затрат по агенту или команде отображается пустой?

Потому что такая атрибуция требует коннектора, который помечает расходы той сессией, агентом или командой, к которым они относятся. Пока он не подключён, разбивка честно остаётся пустой, а не домысливается — и там, где агрегат неполон, он помечается как частичный и никогда не выдаётся за точный итог. Разбивки по модели и поставщику от этого не зависят и присутствуют всегда.

Маршрутизирует и запускает ли Olivares мои вызовы моделей?

Нет. Политику маршрутизации вы задаёте здесь — по стоимости, задержке, возможностям или закреплению, с цепочкой резервирования /resolve, — но исполнение вызова обеспечивает отдельный компонент-шлюз. Model /execute закрыт по умолчанию (deny-closed) и возвращает 503, пока не выделен явно. Эта поверхность — про то, чтобы видеть расходы и управлять ими, а не про то, чтобы Olivares находился в вашем пути inference.

Возьмите расходы на модели под контроль

Разверните Olivares на собственной инфраструктуре, задекларируйте свой парк моделей, атрибутируйте каждый микродоллар и позвольте бюджетам управлять разрешением до того, как затраты возникнут.