Prodotto · Costi e FinOps

Visualizza, attribuisci e governa la spesa per i tuoi modelli

Due moduli in un unico posto: un catalogo dichiarato dei modelli presenti nel tuo parco — capacità, prezzi di listino, policy di routing — e una vista FinOps che suddivide la spesa in token e in costi per modello, fornitore, agente, sessione, team e progetto. Imposta budget e soglie, leggi una proiezione del run-rate e lascia che i segnali di budget condizionino la risoluzione dei modelli. Visualizzare e governare i costi — non Olivares che esegue la tua inferenza.

Vedi il repository Come vengono ricavati i numeri

Nel prodotto

La dashboard dei costi

Uno screenshot autentico, con dati di esempio. La vista executive: spesa a oggi, una proiezione del run-rate, il volume di token, i modelli governati attivi e un grafico dell'andamento della spesa — suddiviso così da vedere dove vanno i soldi.

Dashboard dei costi di Olivares: totali principali di spesa e token, una proiezione del run-rate, il conteggio dei modelli governati attivi e un grafico dell'andamento della spesa nel tempo, popolato con dati di esempio.

Cosa ottieni

Due moduli: il parco dei modelli e il denaro

Un catalogo dei modelli che governi e la policy che li risolve, abbinati a una vista dei costi che attribuisce la spesa governata fino al micro-dollaro.

Un catalogo dichiarato dei modelli

I modelli presenti nel tuo parco con le loro capacità e i prezzi di listino, governati centralmente. Il prezzo è un riferimento dichiarato e datato che modifichi tu — verificalo presso il fornitore; non lo presentiamo mai come verità immutabile.

Policy di routing con una catena di fallback

Definisci come una richiesta viene risolta verso un modello — per costo, latenza, capacità o in modo fissato — con una catena di fallback /resolve. Questa è la policy che decide; eseguire l'inferenza è un passaggio separato e provisionato esplicitamente.

Spesa, attribuita

Spesa in token e in costi suddivisa per modello, fornitore, agente, sessione, team e progetto. Internamente il denaro è espresso in micro-USD interi, quindi i totali tornano esattamente. Le suddivisioni per modello e fornitore sono sempre presenti; l'attribuzione più granulare dipende dal connettore collegato.

Budget capaci di condizionare la risoluzione

Budget con soglie, avvisi e raccomandazioni. Un budget superato può condizionare la risoluzione dei modelli — bloccando o limitando — così i limiti di costo vengono applicati nel punto di decisione, non scoperti sulla fattura.

Cosa è reale

Operativo per visualizzare e governare i costi — non per eseguire la tua inferenza

Siamo precisi su cosa rappresenti ogni numero, perché le decisioni finanziarie dipendono da questo:

Operativo: lettura, analisi e segnalazione dei budget. Spesa per modello, fornitore, agente, sessione, team e progetto; budget con soglie, avvisi e raccomandazioni; e applicazione dei budget che può condizionare la risoluzione dei modelli bloccando o limitando. Le suddivisioni per modello e fornitore sono sempre popolate.
Lacune oneste nei dati: il prezzo di listino è un riferimento dichiarato e datato che gestisci tu — verificalo presso il fornitore prima di agire di conseguenza. La previsione è una proiezione lineare al run-rate corrente, non un modello predittivo. L'attribuzione per agente, per sessione e per team può risultare vuota finché non viene collegato un connettore che attribuisce la sessione — e un aggregato troncato viene mostrato come parziale, mai come totale esatto. Non ricaviamo una cifra di risparmio da cache dal flusso dei costi, quindi non ne mostriamo alcuna.
Roadmap / punto di giunzione: la policy di routing si definisce qui, ma l'esecuzione del routing — il gateway che chiama effettivamente un modello — è un componente separato. Il /execute dei modelli è deny-closed e restituisce 503 senza un provisioning esplicito. Olivares ti aiuta a visualizzare e governare i costi; non esegue l'inferenza al posto tuo.

Costi e FinOps — domande

Da dove arrivano i prezzi — sono live dai fornitori?

No. Il prezzo nel catalogo è un prezzo di listino dichiarato: un riferimento datato che modifichi e mantieni tu, non un feed live. È lì perché le stime dei costi siano coerenti, non perché tu lo tratti come la verità corrente del fornitore. Verificalo presso il fornitore prima di prendere una decisione di conseguenza.

La previsione è una stima di quanto spenderemo?

È una proiezione lineare al run-rate corrente — estende in avanti il tuo attuale ritmo di spesa, niente di più. Non è un modello predittivo e non tiene conto della stagionalità, di modifiche pianificate o di qualsiasi cosa tu non abbia ancora fatto. Leggila come «se nulla cambia, questa è la traiettoria».

Perché alcuni costi per agente o per team risultano vuoti?

Perché quell'attribuzione richiede un connettore che etichetti la spesa con la sessione, l'agente o il team a cui appartiene. Finché non è collegato, la suddivisione è onestamente vuota anziché ipotizzata — e dove un aggregato è incompleto viene etichettato come parziale, mai presentato come totale esatto. Le suddivisioni per modello e fornitore non dipendono da questo e sono sempre presenti.

Olivares instrada ed esegue le mie chiamate ai modelli?

No. La policy di routing la definisci qui — per costo, latenza, capacità o in modo fissato, con una catena di fallback /resolve — ma eseguire la chiamata è un componente gateway separato. Il /execute dei modelli è deny-closed e restituisce 503 a meno che non sia provisionato esplicitamente. Questa superficie riguarda la visualizzazione e la governance dei costi, non Olivares che si inserisce nel tuo percorso di inferenza.

Prendi il controllo della spesa per i tuoi modelli

Distribuisci Olivares sulla tua infrastruttura, dichiara il tuo parco di modelli, attribuisci la spesa governata fino al micro-dollaro e lascia che i budget condizionino la risoluzione prima che il costo venga sostenuto.

Vedi il repository Vedi la mappa degli accessi