본문으로 건너뛰기

제품 · 비용 및 FinOps

모델 지출을 확인하고 귀속하며 거버닝 하십시오

두 개의 모듈을 한곳에서 제공합니다: 보유 자산 내 모델의 선언형 카탈로그 — 역량, 표준 가격, 라우팅 정책 — 와, 토큰 및 비용 지출을 모델·프로바이더·에이전트·세션·팀·프로젝트별로 분해하는 FinOps 뷰입니다. 예산과 임계값을 설정하고, 런레이트 추정을 읽고, 예산 시그널이 모델 리졸루션을 게이팅하게 할 수 있습니다. Olivares가 추론을 실행하는 것이 아니라 비용을 확인하고 거버닝하는 것입니다.

제품 화면에서

비용 대시보드

실제 스크린샷이며 예시 데이터입니다. 경영진 관점의 뷰: 현재까지의 지출, 런레이트 추정, 토큰 볼륨, 활성 거버닝 모델, 그리고 지출 추이 차트 — 자금이 어디로 흐르는지 한눈에 보이도록 분해되어 있습니다.

실제 스크린샷
Olivares 비용 대시보드: 핵심 지출 및 토큰 합계, 런레이트 추정, 활성 거버닝 모델 수, 그리고 시간 경과에 따른 지출 추이 차트가 예시 데이터로 채워져 있습니다.

제공 내용

두 개의 모듈: 모델 자산과 비용

여러분이 거버닝하는 모델의 카탈로그와 이를 리졸브하는 정책, 그리고 모든 마이크로 달러를 귀속하는 비용 뷰를 함께 제공합니다.

선언형 모델 카탈로그

보유 자산 내 모델을 역량과 표준 가격과 함께 중앙에서 거버닝합니다. 가격은 여러분이 직접 편집하는 선언형의 날짜 기준 참고값입니다 — 프로바이더를 기준으로 검증하십시오. 저희는 이를 결코 불변의 진실로 제시하지 않습니다.

폴백 체인을 갖춘 라우팅 정책

요청이 비용·지연·역량 기준으로, 또는 고정 방식으로 모델에 리졸브되는 방식을 /resolve 폴백 체인과 함께 정의하십시오. 이는 결정을 내리는 정책이며, 추론을 실행하는 것은 별도의, 명시적으로 프로비저닝된 단계입니다.

귀속된 지출

토큰 및 비용 지출을 모델·프로바이더·에이전트·세션·팀·프로젝트별로 분해합니다. 자금은 내부적으로 정수형 마이크로 USD로 처리되므로 합계가 정확히 맞아떨어집니다. 모델 및 프로바이더 단위 분해는 항상 제공되며, 더 세밀한 귀속은 연결된 커넥터에 따라 달라집니다.

리졸루션을 게이팅할 수 있는 예산

임계값, 알림, 권장 사항을 갖춘 예산입니다. 초과된 예산은 모델 리졸루션을 게이팅 — 차단 또는 스로틀링 — 할 수 있으므로, 비용 한도가 청구서에서 발견되는 것이 아니라 결정 시점에 강제됩니다.

실제로 가능한 것

비용을 확인하고 거버닝하는 것은 가능 — 추론을 실행하는 것은 아님

재무 결정이 이에 의존하기 때문에, 저희는 각 수치가 무엇인지에 대해 정확히 밝힙니다:

  • 가능: 읽기, 분석, 예산 시그널링. 모델·프로바이더·에이전트·세션·팀·프로젝트별 지출, 임계값·알림·권장 사항을 갖춘 예산, 그리고 차단 또는 스로틀링으로 모델 리졸루션을 게이팅할 수 있는 예산 강제. 모델 및 프로바이더 단위 분해는 항상 채워집니다.
  • 데이터의 정직한 한계: 표준 가격은 여러분이 유지·관리하는 선언형의 날짜 기준 참고값입니다 — 이를 근거로 행동하기 전에 프로바이더를 기준으로 검증하십시오. 예측값은 현재 런레이트 기준의 선형 추정이며 예측 모델이 아닙니다. 에이전트별·세션별·팀별 귀속은 세션을 귀속하는 커넥터가 연결될 때까지 비어 있을 수 있으며 — 잘린 집계값은 정확한 합계가 아니라 부분값으로 표시됩니다. 저희는 비용 스트림에서 캐시 절감 수치를 도출하지 않으므로 이를 표시하지 않습니다.
  • 로드맵 / 이음새: 라우팅 정책은 여기에서 정의되지만, 라우팅 실행 — 실제로 모델을 호출하는 게이트웨이 — 은 별도의 구성 요소입니다. 모델 /execute는 deny-closed 상태이며 명시적인 프로비저닝 없이는 503을 반환합니다. Olivares는 비용을 확인하고 거버닝하도록 돕습니다. 여러분을 대신해 추론을 실행하지는 않습니다.

비용 및 FinOps — 자주 묻는 질문

가격은 어디에서 오나요 — 프로바이더에서 실시간으로 가져오는 건가요?

아닙니다. 카탈로그의 가격은 선언형 표준 가격입니다: 여러분이 직접 편집하고 유지·관리하는 날짜 기준 참고값이며 실시간 피드가 아닙니다. 이는 비용 추정을 일관되게 하기 위한 것이지, 프로바이더의 현재 진실로 취급하기 위한 것이 아닙니다. 이를 근거로 결정을 내리기 전에 프로바이더를 기준으로 검증하십시오.

예측값은 우리가 지출할 금액에 대한 예언인가요?

이는 현재 런레이트 기준의 선형 추정입니다 — 현재의 지출 속도를 그대로 앞으로 연장한 것일 뿐, 그 이상은 아닙니다. 예측 모델이 아니며 계절성, 계획된 변경, 아직 실행하지 않은 사항은 반영하지 않습니다. “아무것도 바뀌지 않는다면 이것이 추세다”라는 의미로 읽으십시오.

일부 에이전트별 또는 팀별 비용이 왜 비어 있게 표시되나요?

해당 귀속에는 지출을 그것이 속한 세션·에이전트·팀으로 태깅하는 커넥터가 필요하기 때문입니다. 이것이 연결될 때까지 분해는 추측이 아니라 정직하게 비어 있으며 — 집계값이 불완전한 경우 정확한 합계로 제시되지 않고 부분값으로 라벨링됩니다. 모델 및 프로바이더 단위 분해는 이에 의존하지 않으며 항상 제공됩니다.

Olivares가 제 모델 호출을 라우팅하고 실행하나요?

아닙니다. 여러분은 여기에서 라우팅 정책을 — 비용·지연·역량 기준으로, 또는 고정 방식으로, /resolve 폴백 체인과 함께 — 정의하지만, 호출을 실행하는 것은 별도의 게이트웨이 구성 요소입니다. 모델 /execute는 deny-closed 상태이며 명시적으로 프로비저닝되지 않는 한 503을 반환합니다. 이 영역은 비용을 확인하고 거버닝하는 것에 관한 것이지, Olivares가 여러분의 추론 경로에 끼어드는 것에 관한 것이 아닙니다.

모델 지출을 통제하십시오

Olivares를 여러분의 인프라에 배포하고, 모델 자산을 선언하고, 모든 마이크로 달러를 귀속하며, 비용이 발생하기 전에 예산이 리졸루션을 게이팅하게 하십시오.