¿Se sitúa Olivares AI en la ruta de las peticiones de mis agentes?

No. El descubrimiento y el mapa de accesos se construyen a partir de telemetría y de auditoría nativa de la fuente fuera de banda, de modo que una caída de Olivares no puede tumbar tus agentes. Las únicas superficies en ruta son los gates de actuación opcionales y deny-closed que conectas explícitamente — y allí un estado de parada ilegible falla cerrado, nunca abierto.

¿Qué detiene realmente el kill switch?

La parada de todo el parque deniega todas las superficies de actuación gobernadas del tenant; una parada con alcance de agente deniega un solo agente. Es read-first por diseño — no puede alcanzar una superficie en la que no hayas conectado un gate. Activarla es barato y de un solo clic; reactivar requiere dual-control y una post-revisión obligatoria.

Una consola para la IA de tu infraestructura

Q: ¿Puede funcionar en modo air-gapped?

El control plane de Olivares sí. Tus datos de gobernanza y observación permanecen dentro de tu perímetro. La salvedad honesta es la inferencia del modelo — los modelos alojados como Claude siguen llegando a la API de su proveedor; solo los modelos genuinamente self-hosteables (vLLM, Ollama) se ejecutan completamente offline.

Ya tienes los dashboards para todo lo demás del parque: hosts, colas, almacenes de datos, la ruta de las peticiones. Entonces aparecen una docena de agentes de IA — copilots, servidores MCP, trabajos programados, una instancia de Claude Code que alguien conectó a producción — y no tienes un único sitio que responda a la primera pregunta del operador: qué está en ejecución, y qué puede alcanzar realmente cada cosa?

Este es el mismo patrón que la shadow infrastructure no gestionada, salvo que las cargas de trabajo tienen credenciales y actúan por su cuenta. De las organizaciones que sufrieron una brecha relacionada con la IA, alrededor del 97% carecía de controles de acceso de IA adecuados (IBM Cost of a Data Breach 2025, Ponemon). La industria ya tiene una palabra para la causa — agent sprawl — y Gartner espera que más del 40% de los proyectos de IA agéntica se cancelen para finales de 2027 (Gartner), a menudo porque nadie pudo operarlos con seguridad una vez que se multiplicaron.

Lo que obtiene un operador

Olivares AI es una plataforma abierta y self-hosteable que se ejecuta donde se ejecutan tus agentes. Los descubre, construye un mapa de accesos de lectura/escritura de lo que cada uno toca, y te da los controles para gobernar y auditar ese acceso. Para un SRE o sysadmin, cinco propiedades importan más que la lista de funcionalidades.

Pasivo — no en la ruta de las peticiones

El descubrimiento se construye a partir de telemetría y de auditoría nativa de la fuente fuera de banda. La vista de salud y fiabilidad es un consumidor del event bus, no un sondeo que abre sockets hacia tu infraestructura — la liveness se infiere de la actividad observada, y un agente que deja de emitir es en sí mismo una señal. Como Olivares no es un proxy ni un sidecar delante de tus agentes, una caída de Olivares no puede tumbarlos. Las únicas superficies que alguna vez se sitúan inline son los gates de actuación opcionales que decidas conectar, y esos fallan cerrados.

Un único binario estático self-hosted

Se despliega como un único binario estático con la consola web embebida — sin flota de agentes que desplegar, sin operador de Kubernetes del control plane que vigilar. El almacén es SQLite pure-Go (Postgres para multi-tenant), así que no hay un toolchain de C contra el que pelear. Instalas un solo fichero, lo ejecutas como un usuario de servicio dedicado, y tienes la cabina de mando. Consulta instalación y self-host.

El control plane se ejecuta dentro de tu perímetro y puede funcionar en modo air-gapped — tus datos de gobernanza y observación nunca salen. Una salvedad a la que los operadores deberían aferrarse: esto no es IA offline. Los modelos alojados como Claude siguen llegando a la API del proveedor; air-gapped significa que los datos de tu parque se quedan en casa, no que el modelo se ejecute localmente. Solo los modelos genuinamente self-hosteables (vLLM, Ollama) se ejecutan completamente offline. Más en seguridad y arquitectura.

Ingesta nativa de OTel

La ruta de ingesta fija las convenciones semánticas GenAI de OpenTelemetry junto a OCSF, los formatos SIEM y W3C Trace Context — de modo que la telemetría que ya emites es la telemetría que lee. Un límite honesto: Olivares correlaciona tu ledger de eventos gobernados por el trace_id de W3C; no almacena spans completos de OTel. Las duraciones y el estado en la vista de traza son ventanas de eventos del ledger, no datos de span reconstruidos. Los spans completos permanecen en tu propio colector OTLP, que es donde corresponde. Olivares te dice quién tocó qué y si estaba permitido — no es un sustituto de tu backend de tracing. (Consulta la página de comparativa para ver dónde se sitúa junto a LiteLLM/Langfuse.)

Probes y salud, como cualquier servicio que ejecutas

El binario expone los endpoints que tu orquestador ya espera:

GET /livez     liveness  — is the process up
GET /readyz    readiness — is it serving (and not a cold standby)
GET /healthz   setup-exempt liveness for scrapers
GET /metrics   Prometheus exposition

/readyz devuelve 503 cuando el almacén de respaldo es inalcanzable, en lugar de quedarse colgado, de modo que un balanceador de carga drena el nodo en lugar de tragárselo en un agujero negro. Además de eso, el módulo XXII rastrea la salud, el SLA y el uptime de los propios agentes y servidores MCP — qué está sano, qué está degradado y qué depende de qué — y emite hallazgos de caída/degradado/ recuperado/incumplimiento de SLA a tu rail existente (Slack, PagerDuty, SIEM). Produce la señal; no intenta ser tu notificador.

Read-first, con una parada real de todo el parque

Olivares es detective por defecto y deny-closed. Observa y gobierna de forma amplia; no actúa de forma amplia. Pero cuando un agente se descontrola a las 3 de la madrugada, un operador necesita una palanca que funcione sin ceremonia — así que el kill switch es real y está construido para usarse:

Activarlo es barato. Nivel admin, un motivo obligatorio, un clic. No hay gate de aprobación ni step-up en el activar — una parada de emergencia que espera quórum no es una parada. El alcance de todo el parque deniega todas las superficies de actuación gobernadas del tenant; el alcance de agente detiene un solo agente en todas las superficies en las que se le pueda nombrar.
Reactivar no lo es. Levantar una parada requiere dual-control (dos personas distintas) y va seguido de una post-revisión obligatoria que una tercera persona, no implicada, debe firmar. “El parque permanece detenido” es el estado seguro.
Falla cerrado. Cada gate de actuación consulta el estado de parada en vivo en cada llamada y deniega ante un error de lectura — una parada ilegible nunca significa “adelante”.

Sé honesto contigo mismo respecto al alcance: la parada es solo tan amplia como los gates que hayas conectado. No puede congelar una superficie en la que Olivares no tiene una costura. Ese es el compromiso deliberado de un sistema read-first — y es la razón por la que el descubrimiento y el mapa van primero.

Qué es esto — y qué no es

Es una cabina de mando pasiva y self-hosted: descubre los agentes, mapea su acceso de lectura/escritura, vigila su salud, y mantén una parada de todo el parque a un clic de distancia.
No es un proxy inline, un backend de tracing, ni un sistema que recablee silenciosamente tus agentes. La actuación es opt-in, on-demand y deny-closed — conectas cada costura deliberadamente.
Es pre-1.0 y open-core. El catálogo lista 29 módulos de capacidad, todos conectados en el binario estándar; la actuación es deliberadamente acotada y mayormente sujeta a aprovisionamiento — algunas superficies permanecen deny-closed hasta que las aprovisionas, y unas pocas son post-v1. La referencia de módulos marca lo que está en vivo.
No está certificado. Olivares está diseñado hacia SOC 2, ISO/IEC 42001 y la Ley de IA de la UE — no posee esas certificaciones, y no afirmará tenerlas. Consulta seguridad para conocer la postura honesta.
La fidelidad es escalonada y se muestra como tal. La cobertura de lectura-vs-escritura es clean en almacenes con auditoría nativa, lossy en algunos almacenes de documentos/vectores, y unknown donde no puede reconstruirse de forma pasiva (Redis, SQLite, D1); la atribución por agente es firm solo cuando la señal lo respalda, y approximate detrás de una cuenta compartida. Nada se adivina. Consulta fidelidad.

Por dónde empezar

Ponlo en marcha: self-host, y luego el quickstart para un parque sintético.
Conecta tu primera señal: conectar una fuente.
Entiende el modelo: permitido vs observado y el mapa de accesos.
Personas próximas al operador: ingeniería de plataforma y responsables de seguridad.

Una sola consola para la IA que corre en tu infraestructura