Naar inhoud

Voor SRE & sysadmins

De cockpit voor de AI-agents die op uw infrastructuur draaien

Ontdek de AI-agents op uw hosts, zie wat elke agent kan lezen en schrijven, en houd een omgevingsbrede stop binnen handbereik — vanuit één self-hosted binary die nooit in het request-pad zit.

U draait al dashboards voor al het andere in uw omgeving: hosts, queues, datastores, het request-pad. Dan duiken er ineens een dozijn AI-agents op — copilots, MCP- servers, geplande jobs, een Claude Code-instantie die iemand aan productie heeft geknoopt — en u heeft geen enkele plek die de eerste vraag van een operator beantwoordt: wat draait er, en wat kan elk ding daadwerkelijk bereiken?

Dit is hetzelfde patroon als onbeheerde shadow-infrastructuur, behalve dat deze workloads credentials bezitten en op eigen houtje handelen. Van de organisaties die een AI-gerelateerd datalek meemaakten, ontbeerde rond de 97% deugdelijke AI-toegangscontroles (IBM Cost of a Data Breach 2025, Ponemon). De sector heeft er inmiddels een woord voor — agent sprawl — en Gartner verwacht dat meer dan 40% van de agentic-AI-projecten tegen eind 2027 wordt geannuleerd (Gartner), vaak omdat niemand ze veilig kon beheren zodra ze zich vermenigvuldigden.

Wat een operator krijgt

Olivares AI is een open, self-hostbaar platform dat draait waar uw agents draaien. Het ontdekt ze, bouwt een read/write-toegangskaart op van wat elke agent raakt, en geeft u de controls om die toegang te gouverneren en te auditen. Voor een SRE of sysadmin tellen vijf eigenschappen zwaarder dan de feature-lijst.

Passief — niet in het request-pad

Ontdekking wordt out of band opgebouwd uit telemetrie en source-native audit. Het health- en betrouwbaarheidsbeeld is een consument van de event bus, geen prober die sockets in uw infrastructuur opent — liveness wordt afgeleid uit waargenomen activiteit, en een agent die stopt met emitteren is op zichzelf al een signaal. Omdat Olivares geen proxy of sidecar vóór uw agents is, kan een storing bij Olivares ze niet platleggen. De enige oppervlakken die ooit inline zitten, zijn de optionele actuatiegates die u ervoor kiest aan te sluiten, en die falen gesloten.

Eén self-hosted statische binary

Het wordt uitgerold als een enkele statische binary met de webconsole ingebed — geen agent-fleet om uit te rollen, geen control-plane Kubernetes-operator om te bewaken. De store is pure-Go SQLite (Postgres voor multi-tenant), dus er is geen C-toolchain om mee te vechten. U installeert één bestand, draait het als een dedicated service-user, en u heeft de cockpit. Zie install & self-host.

Het control plane draait binnen uw perimeter en kan air-gapped draaien — uw governance- en observatiedata verlaten het nooit. Eén kanttekening die operators moeten vasthouden: dit is geen offline AI. Gehoste modellen zoals Claude bereiken nog steeds de API van de provider; air-gapped betekent dat uw omgevingsdata thuis blijft, niet dat het model lokaal draait. Alleen werkelijk self-hostbare modellen (vLLM, Ollama) draaien volledig offline. Meer in security en architecture.

OTel-native ingest

Het ingest-pad legt de OpenTelemetry GenAI semantic conventions vast, naast OCSF, de SIEM-formaten en W3C Trace Context — zodat de telemetrie die u al emitteert, de telemetrie is die het leest. Eén eerlijke grens: Olivares correleert uw grootboek van gegouverneerde events op W3C trace_id; het slaat geen volledige OTel-spans op. Doorlooptijden en status in de trace-weergave zijn vensters van grootboek-events, geen gereconstrueerde span-data. De volledige spans blijven in uw eigen OTLP-collector, waar ze thuishoren. Olivares vertelt u wie wat heeft aangeraakt en of het toegestaan was — het is geen vervanging voor uw tracing- backend. (Zie de compare-pagina voor waar het naast LiteLLM/Langfuse staat.)

Probes en health, zoals elke service die u draait

De binary stelt de endpoints beschikbaar die uw orchestrator al verwacht:

GET /livez     liveness  — is the process up
GET /readyz    readiness — is it serving (and not a cold standby)
GET /healthz   setup-exempt liveness for scrapers
GET /metrics   Prometheus exposition

/readyz geeft 503 terug wanneer de onderliggende store onbereikbaar is in plaats van te blijven hangen, zodat een load balancer de node draineert in plaats van die in een zwart gat te laten verdwijnen. Daarbovenop houdt module XXII de health, SLA en uptime van de agents en MCP-servers zelf bij — wat gezond is, wat gedegradeerd is, en wat van wat afhangt — en emitteert het down/degraded/ recovered/SLA-breach-findings naar uw bestaande rail (Slack, PagerDuty, SIEM). Het produceert het signaal; het probeert niet uw notifier te zijn.

Read-first, met een echte omgevingsbrede stop

Olivares is detective by default en deny-closed. Het observeert en gouverneert breed; het actueert niet breed. Maar wanneer een agent om 3 uur ‘s nachts ontspoort, heeft een operator één hendel nodig die zonder ceremonie werkt — daarom is de kill-switch echt en gebouwd om gebruikt te worden:

  • Activeren is goedkoop. Admin-tier, één verplichte reden, één klik. Er is geen goedkeuringsgate en geen step-up bij het activeren — een noodstop die op een quorum wacht, is geen stop. De omgevingsbrede scope weigert elk gegouverneerd actuatie-oppervlak voor de tenant; de agent-scope stopt één agent over elk oppervlak waar hij benoembaar op is.
  • Opnieuw inschakelen niet. Een stop opheffen vereist dual-control (twee verschillende mensen) en wordt gevolgd door een verplichte post-review die een derde, niet-betrokken persoon moet ondertekenen. “De omgeving blijft gestopt” is de veilige toestand.
  • Het faalt gesloten. Elke actuatiegate raadpleegt de live stoptoestand per call en weigert bij een leesfout — een onleesbare stop betekent nooit “ga je gang”.

Wees eerlijk tegen uzelf over de scope: de stop reikt slechts zo ver als de gates die u heeft aangesloten. Hij kan geen oppervlak bevriezen waar Olivares geen naad in heeft. Dat is de bewuste afweging van een read-first-systeem — en daarom komen ontdekking en de kaart eerst.

Wat dit is — en wat het niet is

  • Het is een passieve, self-hosted cockpit: ontdek de agents, breng hun read/write- toegang in kaart, bewaak hun health, en houd een omgevingsbrede stop één klik weg.
  • Het is geen inline proxy, tracing-backend, of een systeem dat stilletjes uw agents herconfigureert. Actuatie is opt-in, on-demand en deny-closed — u sluit elke naad bewust aan.
  • Het is pre-1.0 en open-core. De catalogus telt 23 capability-modules; ruwweg twintig zijn vandaag aangesloten, de rest is design-stage of post-v1. De modules-referentie markeert wat live is.
  • Het is niet gecertificeerd. Olivares is ontworpen richting SOC 2, ISO/IEC 42001 en de EU AI Act — het bezit die certificeringen niet, en het zal die niet claimen. Zie security voor de eerlijke posture.
  • Fidelity is gelaagd en wordt als zodanig getoond. Read-vs-write-dekking is clean op stores met native audit, lossy op sommige document-/vectorstores, en unknown waar het niet passief gereconstrueerd kan worden (Redis, SQLite, D1); attributie per agent is firm alleen wanneer het signaal het ondersteunt, approximate achter een gedeeld account. Niets wordt geraden. Zie fidelity.

Waar te beginnen

Vragen

Zit Olivares AI in het request-pad van mijn agents?

Nee. Ontdekking en de toegangskaart worden buiten het pad (out of band) opgebouwd uit telemetrie en source-native audit, zodat een storing bij Olivares uw agents niet kan platleggen. De enige in-path-oppervlakken zijn de optionele, deny-closed actuatiegates die u zelf expliciet aansluit — en een onleesbare stoptoestand daar faalt gesloten, nooit open.

Kan het air-gapped draaien?

Het Olivares-control plane wel. Uw governance- en observatiedata blijven binnen uw perimeter. De eerlijke kanttekening betreft de modelinferentie — gehoste modellen zoals Claude bereiken nog steeds de API van hun provider; alleen werkelijk self-hostbare modellen (vLLM, Ollama) draaien volledig offline.

Wat stopt de kill-switch nu precies?

De omgevingsbrede stop weigert elk gegouverneerd actuatie-oppervlak voor de tenant; een agent-gebonden stop weigert één agent. Hij is read-first by design — hij kan geen oppervlak bereiken waar u geen gate in hebt aangesloten. Activeren is goedkoop en gebeurt met één klik; opnieuw inschakelen vereist dual-control en een verplichte post-review.

Probeer het op uw eigen infrastructuur

Olivares AI is open-core (AGPL-3.0) en self-hosted. Rol het uit en zie wat uw agents kunnen bereiken.