跳至正文

产品 · 成本与 FinOps

看清、归因并治理 您的模型支出

两个模块汇于一处:一份声明式的模型目录,涵盖您资产范围内各模型的能力、标价与路由策略;以及一个 FinOps 视图,按模型、提供商、agent、会话、团队和项目拆分 token 与成本支出。设定预算和阈值,读取运行速率预测,并让预算信号在模型解析环节起到门控作用。看清并治理成本——而不是由 Olivares 替您运行推理。

产品内部

成本仪表盘

真实截图,示例数据。这是面向管理层的视图:迄今支出、运行速率预测、token 用量、当前受治理的模型,以及一张支出趋势图——经过拆分,让您看清每一分钱的去向。

真实截图
Olivares 成本仪表盘:核心支出与 token 总量、运行速率预测、当前受治理模型的计数,以及一张随时间变化的支出趋势图,均以示例数据填充。

您将获得

两个模块:模型资产,以及资金

一份您所治理模型的目录,搭配解析这些模型的策略,再配以一个将每一微美元都归因到位的成本视图。

声明式模型目录

您资产范围内的各模型及其能力与标价,集中治理。定价是一份由您编辑、带日期的声明式参考——请对照提供商核实;我们绝不将其呈现为不可改变的事实。

带回退链的路由策略

定义一个请求如何解析到某个模型——按成本、延迟、能力或固定指定——并配以 /resolve 回退链。这是负责决策的策略;运行推理则是一个独立、需显式置备的环节。

支出,已归因

按模型、提供商、agent、会话、团队和项目拆分的 token 与成本支出。资金在内部以整数微美元(micro-USD)计量,因此各项总计能精确相加。模型与提供商维度的拆分始终有数据;更细粒度的归因则取决于所接入的连接器。

可门控解析的预算

带阈值、告警与建议的预算。超出预算时,可通过拦截或限流来门控模型解析——从而在决策环节强制执行成本上限,而不是在账单上才发现。

哪些是真实的

已上线用于看清并治理成本——而非替您运行推理

我们对每个数字的含义都力求精确,因为财务决策有赖于此:

  • 已上线:读取、分析与预算信号发送。按模型、提供商、agent、会话、团队和项目划分的支出;带阈值、告警与建议的预算;以及可通过拦截或限流来门控模型解析的预算强制执行。模型与提供商维度的拆分始终有数据填充。
  • 数据中诚实存在的空缺:标价是一份由您维护、带日期的声明式参考——在据此行动前请对照提供商核实。预测是按当前运行速率所做的线性外推,并非预测模型。在接入具备会话归因能力的连接器之前,按 agent、按会话和按团队的归因可能显示为空——且被截断的聚合值会标注为部分数据,绝不冒充精确总计。我们不会从成本数据流中推算缓存节省额,因此也不会展示该项。
  • 路线图 / 衔接点:路由策略在此定义,但路由执行——真正调用模型的网关——是一个独立组件。模型 /execute 默认拒绝(deny-closed),未经显式置备将返回 503。Olivares 帮助您看清并治理成本;它不会替您运行推理。

成本与 FinOps——常见问题

这些价格从何而来——是从提供商实时获取的吗?

不是。目录中的定价是一份声明式标价:由您编辑和维护、带日期的参考,而非实时数据源。它的存在是为了让成本估算保持一致,而不是让您将其当作提供商的当前真实价格。在据此做决策前,请对照提供商核实。

预测是对我们将要花多少钱的预言吗?

它是按当前运行速率所做的线性外推——把您当前的支出速率向前延伸,仅此而已。它不是预测模型,不考虑季节性、计划中的变更或任何您尚未做的事。请把它理解为「若一切不变,趋势将是如此」。

为什么某些按 agent 或按团队的成本显示为空?

因为这类归因需要一个连接器,将支出标记到其所属的会话、agent 或团队上。在接入之前,该拆分会诚实地留空,而不是凭空猜测——并且在聚合值不完整时会标注为部分数据,绝不冒充精确总计。模型与提供商维度的拆分不依赖于此,始终有数据。

Olivares 会路由并运行我的模型调用吗?

不会。您在此定义路由策略——按成本、延迟、能力或固定指定,并配以 /resolve 回退链——但执行调用是一个独立的网关组件。模型 /execute 默认拒绝(deny-closed),除非显式置备,否则返回 503。这一界面关乎看清并治理成本,而不是让 Olivares 横亘在您的推理路径之中。

掌控您的模型支出

在您自己的基础设施上部署 Olivares,声明您的模型资产,将每一微美元都归因到位,并让预算在成本产生之前就门控解析。