Продукт · Cost & FinOps
Видьте свои расходы на модели, атрибутируйте и управляйте ими
Два модуля в одном месте: декларируемый каталог моделей в вашем парке — их возможности, прейскурантные цены, политика маршрутизации — и представление FinOps, которое раскладывает расход токенов и затрат по модели, поставщику, агенту, сессии, команде и проекту. Задавайте бюджеты и пороги, читайте проекцию по текущему темпу и позвольте бюджетным сигналам управлять разрешением модели. Видеть расходы и управлять ими — а не запускать ваш inference силами Olivares.
В продукте
Дашборд затрат
Настоящий скриншот, демонстрационные данные. Представление для руководства: расходы на текущую дату, проекция по текущему темпу, объём токенов, активные управляемые модели и график динамики затрат — в разбивке, чтобы вы видели, куда уходят деньги.
Что вы получаете
Два модуля: парк моделей и деньги
Каталог моделей, которыми вы управляете, и политика их разрешения в паре с представлением затрат, которое атрибутирует каждый микродоллар.
Декларируемый каталог моделей
Модели в вашем парке с их возможностями и прейскурантными ценами, управляемые централизованно. Цена — это декларируемый датированный ориентир, который вы редактируете сами: сверяйте его с поставщиком; мы никогда не выдаём его за неизменную истину.
Политика маршрутизации с цепочкой резервирования
Определите, как запрос разрешается в модель — по стоимости, задержке, возможностям или закреплению — с цепочкой резервирования /resolve. Это политика, которая принимает решение; запуск inference — отдельный, явно подготовленный шаг.
Расходы, атрибутированные
Расход токенов и затрат в разбивке по модели, поставщику, агенту, сессии, команде и проекту. Внутри деньги хранятся как целочисленные микро-USD, поэтому итоги сходятся точно. Разбивки по модели и поставщику присутствуют всегда; более тонкая атрибуция зависит от подключённого коннектора.
Бюджеты, способные управлять разрешением
Бюджеты с порогами, оповещениями и рекомендациями. Превышенный бюджет может управлять разрешением модели — блокировать или ограничивать — так что лимиты затрат применяются в точке принятия решения, а не обнаруживаются в счёте.
Что реально
Доступно для того, чтобы видеть расходы и управлять ими — но не для запуска вашего inference
Мы точны в том, что именно означает каждая цифра, потому что от этого зависят финансовые решения:
- Доступно: чтение, аналитика и бюджетная сигнализация. Расходы по модели, поставщику, агенту, сессии, команде и проекту; бюджеты с порогами, оповещениями и рекомендациями; а также применение бюджета, способное управлять разрешением модели через блокировку или ограничение. Разбивки по модели и поставщику заполнены всегда.
- Честные пробелы в данных: прейскурантная цена — это декларируемый датированный ориентир, который вы поддерживаете сами: сверьте его с поставщиком, прежде чем на него опираться. Прогноз — это линейная проекция по текущему темпу, а не предсказательная модель. Атрибуция по агенту, сессии и команде может оставаться пустой, пока не подключён коннектор с атрибуцией по сессиям — а усечённый агрегат показывается как частичный, но никогда как точный итог. Мы не выводим из потока затрат величину экономии на кэше, поэтому и не показываем её.
- Дорожная карта / стык: политика маршрутизации задаётся здесь, но исполнение маршрутизации — шлюз, который фактически вызывает модель, — это отдельный компонент. Model /execute закрыт по умолчанию (deny-closed) и возвращает 503 без явной подготовки. Olivares помогает вам видеть расходы и управлять ими; он не запускает inference за вас.
Cost & FinOps — вопросы
Откуда берутся цены — поступают ли они напрямую от поставщиков?
Нет. Цена в каталоге — это декларируемая прейскурантная цена: датированный ориентир, который вы редактируете и поддерживаете, а не живой канал данных. Он существует для того, чтобы оценки затрат были согласованными, а не чтобы вы воспринимали его как актуальную истину поставщика. Сверьте его с поставщиком, прежде чем принимать на его основе решение.
Является ли прогноз предсказанием того, сколько мы потратим?
Это линейная проекция по текущему темпу — она продлевает ваш нынешний темп расходов вперёд, не более того. Это не предсказательная модель, и она не учитывает сезонность, запланированные изменения или то, что вы ещё не сделали. Читайте её так: «если ничего не изменится, такова траектория».
Почему часть затрат по агенту или команде отображается пустой?
Потому что такая атрибуция требует коннектора, который помечает расходы той сессией, агентом или командой, к которым они относятся. Пока он не подключён, разбивка честно остаётся пустой, а не домысливается — и там, где агрегат неполон, он помечается как частичный и никогда не выдаётся за точный итог. Разбивки по модели и поставщику от этого не зависят и присутствуют всегда.
Маршрутизирует и запускает ли Olivares мои вызовы моделей?
Нет. Политику маршрутизации вы задаёте здесь — по стоимости, задержке, возможностям или закреплению, с цепочкой резервирования /resolve, — но исполнение вызова обеспечивает отдельный компонент-шлюз. Model /execute закрыт по умолчанию (deny-closed) и возвращает 503, пока не выделен явно. Эта поверхность — про то, чтобы видеть расходы и управлять ими, а не про то, чтобы Olivares находился в вашем пути inference.
Возьмите расходы на модели под контроль
Разверните Olivares на собственной инфраструктуре, задекларируйте свой парк моделей, атрибутируйте каждый микродоллар и позвольте бюджетам управлять разрешением до того, как затраты возникнут.