Ya tienes los dashboards para todo lo demás del parque: hosts, colas, almacenes de datos, la ruta de las peticiones. Entonces aparecen una docena de agentes de IA — copilots, servidores MCP, trabajos programados, una instancia de Claude Code que alguien conectó a producción — y no tienes un único sitio que responda a la primera pregunta del operador: qué está en ejecución, y qué puede alcanzar realmente cada cosa?
Este es el mismo patrón que la shadow infrastructure no gestionada, salvo que las cargas de trabajo tienen credenciales y actúan por su cuenta. De las organizaciones que sufrieron una brecha relacionada con la IA, alrededor del 97% carecía de controles de acceso de IA adecuados (IBM Cost of a Data Breach 2025, Ponemon). La industria ya tiene una palabra para la causa — agent sprawl — y Gartner espera que más del 40% de los proyectos de IA agéntica se cancelen para finales de 2027 (Gartner), a menudo porque nadie pudo operarlos con seguridad una vez que se multiplicaron.
Lo que obtiene un operador
Olivares AI es una plataforma abierta y self-hosteable que se ejecuta donde se ejecutan tus agentes. Los descubre, construye un mapa de accesos de lectura/escritura de lo que cada uno toca, y te da los controles para gobernar y auditar ese acceso. Para un SRE o sysadmin, cinco propiedades importan más que la lista de funcionalidades.
Pasivo — no en la ruta de las peticiones
El descubrimiento se construye a partir de telemetría y de auditoría nativa de la fuente fuera de banda. La vista de salud y fiabilidad es un consumidor del event bus, no un sondeo que abre sockets hacia tu infraestructura — la liveness se infiere de la actividad observada, y un agente que deja de emitir es en sí mismo una señal. Como Olivares no es un proxy ni un sidecar delante de tus agentes, una caída de Olivares no puede tumbarlos. Las únicas superficies que alguna vez se sitúan inline son los gates de actuación opcionales que decidas conectar, y esos fallan cerrados.
Un único binario estático self-hosted
Se despliega como un único binario estático con la consola web embebida — sin flota de agentes que desplegar, sin operador de Kubernetes del control plane que vigilar. El almacén es SQLite pure-Go (Postgres para multi-tenant), así que no hay un toolchain de C contra el que pelear. Instalas un solo fichero, lo ejecutas como un usuario de servicio dedicado, y tienes la cabina de mando. Consulta instalación y self-host.
El control plane se ejecuta dentro de tu perímetro y puede funcionar en modo air-gapped — tus datos de gobernanza y observación nunca salen. Una salvedad a la que los operadores deberían aferrarse: esto no es IA offline. Los modelos alojados como Claude siguen llegando a la API del proveedor; air-gapped significa que los datos de tu parque se quedan en casa, no que el modelo se ejecute localmente. Solo los modelos genuinamente self-hosteables (vLLM, Ollama) se ejecutan completamente offline. Más en seguridad y arquitectura.
Ingesta nativa de OTel
La ruta de ingesta fija las convenciones semánticas GenAI de OpenTelemetry junto a OCSF,
los formatos SIEM y W3C Trace Context — de modo que la telemetría que ya emites es la
telemetría que lee. Un límite honesto: Olivares correlaciona tu ledger de eventos gobernados
por el trace_id de W3C; no almacena spans completos de OTel. Las duraciones y el estado
en la vista de traza son ventanas de eventos del ledger, no datos de span reconstruidos. Los spans
completos permanecen en tu propio colector OTLP, que es donde corresponde. Olivares te dice quién
tocó qué y si estaba permitido — no es un sustituto de tu backend de tracing.
(Consulta la página de comparativa para ver dónde se sitúa junto a LiteLLM/Langfuse.)
Probes y salud, como cualquier servicio que ejecutas
El binario expone los endpoints que tu orquestador ya espera:
GET /livez liveness — is the process up
GET /readyz readiness — is it serving (and not a cold standby)
GET /healthz setup-exempt liveness for scrapers
GET /metrics Prometheus exposition
/readyz devuelve 503 cuando el almacén de respaldo es inalcanzable, en lugar de quedarse colgado, de modo que un
balanceador de carga drena el nodo en lugar de tragárselo en un agujero negro. Además de eso, el módulo XXII
rastrea la salud, el SLA y el uptime de los propios agentes y servidores MCP — qué
está sano, qué está degradado y qué depende de qué — y emite hallazgos de caída/degradado/
recuperado/incumplimiento de SLA a tu rail existente (Slack, PagerDuty, SIEM). Produce la señal; no intenta ser tu notificador.
Read-first, con una parada real de todo el parque
Olivares es detective por defecto y deny-closed. Observa y gobierna de forma amplia; no actúa de forma amplia. Pero cuando un agente se descontrola a las 3 de la madrugada, un operador necesita una palanca que funcione sin ceremonia — así que el kill switch es real y está construido para usarse:
- Activarlo es barato. Nivel admin, un motivo obligatorio, un clic. No hay gate de aprobación ni step-up en el activar — una parada de emergencia que espera quórum no es una parada. El alcance de todo el parque deniega todas las superficies de actuación gobernadas del tenant; el alcance de agente detiene un solo agente en todas las superficies en las que se le pueda nombrar.
- Reactivar no lo es. Levantar una parada requiere dual-control (dos personas distintas) y va seguido de una post-revisión obligatoria que una tercera persona, no implicada, debe firmar. “El parque permanece detenido” es el estado seguro.
- Falla cerrado. Cada gate de actuación consulta el estado de parada en vivo en cada llamada y deniega ante un error de lectura — una parada ilegible nunca significa “adelante”.
Sé honesto contigo mismo respecto al alcance: la parada es solo tan amplia como los gates que hayas conectado. No puede congelar una superficie en la que Olivares no tiene una costura. Ese es el compromiso deliberado de un sistema read-first — y es la razón por la que el descubrimiento y el mapa van primero.
Qué es esto — y qué no es
- Es una cabina de mando pasiva y self-hosted: descubre los agentes, mapea su acceso de lectura/escritura, vigila su salud, y mantén una parada de todo el parque a un clic de distancia.
- No es un proxy inline, un backend de tracing, ni un sistema que recablee silenciosamente tus agentes. La actuación es opt-in, on-demand y deny-closed — conectas cada costura deliberadamente.
- Es pre-1.0 y open-core. El catálogo lista 23 módulos de capacidad; aproximadamente veinte están conectados hoy, el resto están en fase de diseño o son post-v1. La referencia de módulos marca lo que está en vivo.
- No está certificado. Olivares está diseñado hacia SOC 2, ISO/IEC 42001 y la Ley de IA de la UE — no posee esas certificaciones, y no afirmará tenerlas. Consulta seguridad para conocer la postura honesta.
- La fidelidad es escalonada y se muestra como tal. La cobertura de lectura-vs-escritura es
cleanen almacenes con auditoría nativa,lossyen algunos almacenes de documentos/vectores, yunknowndonde no puede reconstruirse de forma pasiva (Redis, SQLite, D1); la atribución por agente esfirmsolo cuando la señal lo respalda, yapproximatedetrás de una cuenta compartida. Nada se adivina. Consulta fidelidad.
Por dónde empezar
- Ponlo en marcha: self-host, y luego el quickstart para un parque sintético.
- Conecta tu primera señal: conectar una fuente.
- Entiende el modelo: permitido vs observado y el mapa de accesos.
- Personas próximas al operador: ingeniería de plataforma y responsables de seguridad.