Przejdź do treści

Produkt · Koszty i FinOps

Zobacz, przypisz i zarządzaj wydatkami na modele

Dwa moduły w jednym miejscu: zadeklarowany katalog modeli w infrastrukturze — możliwości, cennik katalogowy, polityka routingu — oraz widok FinOps, który rozkłada wydatki na tokeny i koszty według modelu, dostawcy, agenta, sesji, zespołu i projektu. Ustaw budżety i progi, odczytaj prognozę bieżącego tempa wydatków i pozwól, aby sygnały budżetowe mogły blokować rozstrzyganie modeli. Wgląd i zarządzanie kosztami — to nie Olivares uruchamia wnioskowanie za Państwa.

W produkcie

Pulpit kosztów

Prawdziwy zrzut ekranu, dane przykładowe. Widok kierowniczy: dotychczasowe wydatki, prognoza bieżącego tempa wydatków, wolumen tokenów, aktywne zarządzane modele oraz wykres trendu wydatków — rozłożone tak, aby było widać, dokąd trafiają pieniądze.

Rzeczywisty zrzut ekranu
Pulpit kosztów Olivares: kluczowe sumy wydatków i tokenów, prognoza bieżącego tempa wydatków, liczba aktywnych zarządzanych modeli oraz wykres trendu wydatków w czasie, wypełnione danymi przykładowymi.

Co otrzymujesz

Dwa moduły: park modeli i pieniądze

Katalog zarządzanych modeli i polityka, która je rozstrzyga, w parze z widokiem kosztów przypisującym każdego mikrodolara.

Zadeklarowany katalog modeli

Modele w Państwa infrastrukturze wraz z ich możliwościami i cennikiem katalogowym, zarządzane centralnie. Cennik to zadeklarowany, datowany punkt odniesienia, który Państwo edytują — należy go zweryfikować u dostawcy; nigdy nie przedstawiamy go jako niezmiennej prawdy.

Polityka routingu z łańcuchem awaryjnym

Określ, jak żądanie zostaje rozstrzygnięte do modelu — według kosztu, opóźnienia, możliwości lub przypięcia — z łańcuchem awaryjnym /resolve. To jest polityka, która podejmuje decyzję; uruchomienie wnioskowania to odrębny, jawnie wyposażony krok.

Wydatki, przypisane

Wydatki na tokeny i koszty w podziale na model, dostawcę, agenta, sesję, zespół i projekt. Pieniądze są wewnętrznie liczone w całkowitych mikrodolarach USD, dzięki czemu sumy zgadzają się co do grosza. Podziały według modelu i dostawcy są zawsze obecne; dokładniejsze przypisanie zależy od podłączonego konektora.

Budżety, które mogą sterować rozstrzyganiem

Budżety z progami, alertami i rekomendacjami. Przekroczony budżet może blokować rozstrzyganie modeli — wstrzymać je lub ograniczyć przepustowość — tak aby limity kosztów były egzekwowane w punkcie decyzyjnym, a nie odkrywane na fakturze.

Co jest rzeczywiste

Służy do obserwacji i zarządzania kosztami — nie do uruchamiania Państwa wnioskowania

Precyzyjnie określamy, czym jest każda liczba, ponieważ zależą od tego decyzje finansowe:

  • Działa: odczyt, analiza i sygnalizowanie budżetu. Wydatki według modelu, dostawcy, agenta, sesji, zespołu i projektu; budżety z progami, alertami i rekomendacjami; oraz egzekwowanie budżetu, które może blokować rozstrzyganie modeli przez wstrzymanie lub ograniczenie przepustowości. Podziały według modelu i dostawcy są zawsze wypełnione.
  • Uczciwe luki w danych: cennik katalogowy to zadeklarowany, datowany punkt odniesienia, który Państwo utrzymują — należy go zweryfikować u dostawcy, zanim podejmą Państwo na jego podstawie działanie. Prognoza to liniowa projekcja przy bieżącym tempie wydatków, a nie model predykcyjny. Przypisanie według agenta, sesji i zespołu może wyświetlać się jako puste, dopóki nie zostanie podłączony konektor przypisujący sesje — a tam, gdzie agregat jest niekompletny, jest pokazywany jako częściowy, nigdy jako dokładna suma. Nie wyprowadzamy wartości oszczędności z pamięci podręcznej ze strumienia kosztów, więc jej nie pokazujemy.
  • Plan rozwoju / styk: polityka routingu jest tu definiowana, ale wykonanie routingu — brama, która faktycznie wywołuje model — to odrębny komponent. Model /execute jest domyślnie zamknięty (deny-closed) i zwraca 503 bez jawnego wyposażenia. Olivares pomaga Państwu obserwować koszty i nimi zarządzać; nie uruchamia jednak wnioskowania za Państwa.

Koszty i FinOps — pytania

Skąd pochodzą ceny — czy są pobierane na żywo od dostawców?

Nie. Cennik w katalogu to zadeklarowana cena katalogowa: datowany punkt odniesienia, który Państwo edytują i utrzymują, a nie kanał na żywo. Istnieje po to, aby szacunki kosztów były spójne, a nie po to, by traktować go jako bieżącą prawdę dostawcy. Należy go zweryfikować u dostawcy, zanim podejmą Państwo na jego podstawie decyzję.

Czy prognoza to przewidywanie tego, ile wydamy?

To liniowa projekcja przy bieżącym tempie wydatków — przedłuża obecne tempo wydatków w przyszłość, nic więcej. Nie jest to model predykcyjny i nie uwzględnia sezonowości, planowanych zmian ani niczego, czego jeszcze Państwo nie wykonali. Należy ją odczytywać jako „jeśli nic się nie zmieni, taka będzie trajektoria”.

Dlaczego część kosztów według agenta lub zespołu wyświetla się jako pusta?

Ponieważ to przypisanie wymaga konektora, który oznacza wydatki sesją, agentem lub zespołem, do których należą. Dopóki nie zostanie on podłączony, podział jest uczciwie pusty, a nie zgadywany — a tam, gdzie agregat jest niekompletny, oznaczamy go jako częściowy, nigdy nie przedstawiając jako dokładnej sumy. Podziały według modelu i dostawcy nie zależą od tego i są zawsze obecne.

Czy Olivares kieruje i uruchamia wywołania moich modeli?

Nie. To Państwo definiują tutaj politykę routingu — według kosztu, opóźnienia, możliwości lub przypięcia, z łańcuchem awaryjnym /resolve — ale wykonanie wywołania to odrębny komponent bramy. Model /execute jest domyślnie zamknięty (deny-closed) i zwraca 503, o ile nie zostanie jawnie wyposażony. Ta powierzchnia dotyczy wglądu i zarządzania kosztami, a nie tego, by Olivares znajdował się na Państwa ścieżce wnioskowania.

Przejmij kontrolę nad wydatkami na modele

Wdróż Olivares na własnej infrastrukturze, zadeklaruj park modeli, przypisz każdego mikrodolara i pozwól, aby budżety mogły blokować rozstrzyganie, zanim koszt zostanie poniesiony.