본문으로 건너뛰기

data-residency

Self-hosted AI 거버넌스와 데이터 레지던시: 가장 강력한 GDPR 논리

작성자 Olivares AI 5 분 소요

AI 거버넌스에 관한 데이터 보호 논의는 대부분 잘못된 지점에서 시작됩니다. 벤더가 어떤 인증을 보유하고 있는지, 어떤 하위 프로세서를 명시하고 있는지, 그 클라우드가 어느 리전에 있는지를 묻습니다. 모두 타당한 질문입니다. 하지만 여러분의 AI 에이전트를 관찰하는 특정 범주의 도구 — 인프라상의 모든 에이전트, 세션, 모델, MCP 서버를 발견하고 각각이 무엇에 도달할 수 있는지를 매핑하는 도구 — 에 대해서는, 그 아래에 더 근본적인 질문이 숨어 있습니다. 거버넌스 도구 자체가 과연 여러분의 데이터를 받기는 하는가?

답이 ‘그렇다’라면, 여러분은 방금 새로운 프로세서, 민감한 자료의 새로운 사본, 침해당하거나 소환장이 발부되거나 외부로 통신하도록 만들어질 수 있는 새로운 장소를 만들어 낸 것입니다. 답이 ‘아니다’라면 — 설계상 구조적으로 그렇다면 — 후속되는 GDPR 질문 대부분이 훨씬 작아집니다. 이것이 바로 AI 플랫폼을 self-hosting해야 하는 논거이며, 과장 없이 정확하게 짚어 둘 가치가 있습니다.

정작 중요한 프라이버시 보장은 인증서가 아니라 구조적인 것이다

SOC 2 보고서나 ISO 27001 인증서는 벤더가 자신이 보유한 데이터를 둘러싸고 프로세스를 갖추고 있음을 알려 줍니다. 이는 유용하지만, 여러분 데이터에 대한 액세스의 거버넌스에 관한 진술일 뿐입니다. 훨씬 강력한 보장은 애초에 데이터를 보유하지 않는 것입니다. 결코 받은 적 없는 것은 유출하거나, 잘못 다루거나, 공개하도록 강제당할 수 없습니다.

Self-hosting은 바로 그것을 제공합니다. 컨트롤 플레인이 여러분 자신의 호스트, 클러스터, 클라우드 안에서 — egress 없이 완전히 air-gapped된 형태까지 포함하여 — 실행될 때, 그것이 관찰하는 민감한 자료는 결코 여러분의 경계를 넘지 않습니다. 벤더는 여러분의 운영 데이터를 결코 보지 않으므로 그 데이터의 하위 프로세서가 아닙니다. 이는 여러분이 감사해야 할 정책상의 약속이 아니라 아키텍처적 사실입니다.

이 제품의 위치를 분명히 해 둡니다. Olivares AI는 출시 전 단계입니다. SOC 2, ISO/IEC 27001, EU AI Act 또는 그 밖의 어떤 프레임워크로도 인증받지 않았으며, 진행 중인 감사도 없습니다. 본 제품은 이들 프레임워크가 검토하는 통제 목표 — 감사 로깅, 액세스 제어, 무결성, 암호화, 변경 관리 — 에 맞추어 설계되어 있어, 때가 되면 감사를 받을 준비가 되어 있습니다. 아래의 레지던시 논거는 어떤 인증에도 의존하지 않으며, 바로 그것이 핵심입니다.

페이로드가 아니라 엣지

핵심 설계 결정은 무엇을 저장하느냐입니다. AI 거버넌스 도구는 누가 무엇을 건드릴 수 있는지를 이해해야 합니다. 그 접촉을 통해 흐르는 쿼리의 내용, 프롬프트 본문, 시크릿, 개인정보는 필요로 하지 않습니다.

그래서 그래프는 페이로드가 아니라 엣지를 저장합니다. 즉 에이전트와 리소스 사이의 액세스 관계, 그리고 그 액세스가 읽기(R)인지 읽기/쓰기(RW)인지를 저장합니다. data-export-job → prod-postgres (RW)는 하나의 엣지입니다. 그 작업이 읽은 행(row)은 저장되지 않습니다. 맵은 어떤 에이전트가 s3://billing-exports 안의 객체에 도달했다는 사실을 기록할 뿐, 그 export를 복사하지는 않습니다.

저장됨 (액세스 맵)저장되지 않음
에이전트 신원 (역할 / 애플리케이션 이름)자격 증명 값, 토큰, 키
도달한 리소스 (prod-postgres)쿼리 본문, 결과 행
액세스 유형 — R 또는 RW프롬프트 및 응답 페이로드
타임스탬프, 결과, 신뢰 수준전송 중인 시크릿, PII

시크릿이나 개인정보를 담고 있을 수 있는 입력은 무엇이든 기록되기 전에 레닥션(redaction) 처리되고 시크릿 스캔을 거치므로, 레닥션은 나중에 정리하는 작업이 아니라 수집의 엣지에서 이루어집니다. 저장하지 않는 것은 유출할 수 없으며 — 유출할 수 없는 것은 여러분의 GDPR 처리 범위를 확장하지 않습니다.

데이터가 경계 안에 머무는 방식

운영상 이를 정직하게 유지하는 세 가지 속성이 있습니다.

읽기 우선 관찰(Read-first observation). 컬렉터는 여러분이 이미 생성하고 있는 신호 — 애플리케이션 및 감사 로그, OpenTelemetry, 그리고 커널 레벨의 그라운드 트루스 백스톱으로서의 eBPF — 를 통해 관찰합니다. 에이전트의 데이터 경로상에 위치한 프록시가 아니므로 액세스의 형태를 볼 뿐 내용은 보지 않으며, 장애가 나더라도 결코 프로덕션을 망가뜨리지 않습니다. 여러분의 트래픽을 복사하는 강제적인 중간자(man-in-the-middle)는 존재하지 않습니다.

외부로 보내는 텔레메트리 없음(No telemetry home). secure-by-default는 phone-home가 없음을 의미합니다. 벤더 텔레메트리는 여러분이 명시적으로 켜지 않는 한 꺼져 있습니다. 여러분의 자산에 관한 그 무엇도 — 에이전트 이름도, 액세스 맵도, 사용량 집계도 — 기본적으로 벤더에게 다시 전송되지 않습니다.

egress가 전혀 없는 air-gapped 운영. 연결이 차단된, 규제 대상이거나 기밀 분류된 네트워크에서는 컨트롤 플레인이 전적으로 로컬에서 실행되며 라이선싱은 오프라인으로 검증됩니다. 외부로 나가는 경로는 전혀 없습니다. EU 데이터가 여러분의 통제 하에 있는 EU 인프라에 머물러야 한다는 데이터 레지던시 요구사항에 대해, air-gapped self-hosted 배포는 가능한 가장 문자 그대로의 답입니다. 데이터가 이동할 곳이 없으므로 데이터는 결코 이동하지 않습니다.

보존(retention)과 퍼지(purge)는 구성 가능하므로, 액세스 맵조차 얼마나 오래 유지될지를 여러분이 제어합니다.

GDPR 제28조에 매핑하기 — 정직하게

GDPR 제28조는 컨트롤러–프로세서 관계와 Data Processing Agreement가 다루어야 할 내용을 규율합니다. 여기서 주목할 점은, self-hosted 배포에서는 여러분의 운영 데이터에 대한 통상적인 ‘벤더-프로세서’ 관계가 대체로 해소된다는 것입니다. 도구가 여러분의 인프라에서 실행되고 그 데이터를 결코 받지 않기 때문에, 대부분의 배포에서 여러분은 자신의 환경 내에서 자신의 데이터에 대한 컨트롤러이자 프로세서로 남습니다.

그렇다고 DPA가 무의미해지는 것은 아닙니다. 상업적 관계에서는 책임을 형식화하는 일 — 소프트웨어 공급망에 대해, 지원 액세스에 대해, 향후의 어떠한 매니지드 구성요소에 대해 — 이 여전히 유익합니다. 제28조에 따른 Data Processing Agreement는 엔터프라이즈 조달을 위해 요청 시 제공됩니다. 달라지는 것은 그 범위입니다. 여러분의 개인정보가 보내진 장소의 목록이 없는 이유는, 애초에 보내진 적이 없기 때문입니다. 이는 “우리의 하위 프로세서 목록을 신뢰하라”보다 DPO나 조달팀과 훨씬 짧고 훨씬 방어 가능한 대화입니다.

이것은 구조적인 논거이므로, 그 경계 또한 같은 정직함으로 다루어야 합니다. Self-hosting은 레지던시와 처리 책임을 여러분에게 옮길 뿐, 그 책임을 없애지는 않습니다. 여러분은 여전히 호스트를 보호하고, 보존 기간을 제어하며, 누가 액세스 맵을 읽을 수 있는지를 다스려야 합니다 — 그리고 그 맵 자체가 민감하기 때문에, 맵에 대한 모든 권한 있는 조회는 감사되고 구성요소들은 mutual TLS로 서로를 인증합니다. 본 제품은 벤더 측 표면을 거의 0에 가깝게 줄여 주지만, 운영자의 책임을 면제해 주지는 않습니다.

핵심 정리

규제 당국이, DPO가, 또는 여러분 자신의 보안팀이 “이 AI 거버넌스 도구를 도입하면 우리 데이터는 어디로 가는가”라고 묻는다면, 가능한 가장 강력한 답은 “어디로도 가지 않는다 — 데이터는 결코 떠나지 않으며, 도구는 결코 그것을 보지 않는다”입니다. 이 답은 아키텍처에서 나옵니다. self-hosted 실행, 페이로드가 아니라 엣지를 저장하는 방식, 기록 전 레닥션, 외부로 보내는 텔레메트리 없음, 그리고 egress가 전혀 없는 air-gapped 운영입니다. 인증서는 좋은 프로세스를 뒷받침할 수 있을 뿐, 애초에 받은 적 없는 데이터가 주는 보장에는 미치지 못합니다.

이 태세의 완전하고 정직한 버전 — 아직 인증받지 않은 컴플라이언스 입장과 GDPR 제28조 DPA가 어떻게 들어맞는지를 포함하여 — 을 원하신다면 /security를 참고하시기 바랍니다. 주장을 뒷받침하는 코드를 직접 읽어 보시려면, 완전한 제품을 /open-source 페이지에서 AGPL-3.0 하에 self-hosting할 수 있습니다.

자주 묻는 질문

Self-hosted AI 거버넌스 도구가 GDPR 노출을 줄여 줍니까?

예, 구조적으로 그렇습니다. 컨트롤 플레인이 여러분 자신의 경계 안에서 실행되고 페이로드, 시크릿, PII가 아니라 액세스 관계(어떤 에이전트가 어떤 리소스에 도달하는지, 읽기 전용인지 읽기/쓰기인지)만 저장한다면, 그 도구는 결코 여러분 개인정보의 벤더 측 프로세서가 되지 않습니다. 외부로 보낼 것이 없으며, air-gapped 모드에서는 egress가 전혀 발생하지 않습니다. 여러분은 GDPR 제28조 하에서 일반적으로 자신의 인프라 내에서 컨트롤러이자 프로세서로 남습니다.

Olivares AI는 SOC 2나 ISO 27001 인증을 받았습니까?

아닙니다. 본 제품은 출시 전 단계이며 SOC 2, ISO/IEC 27001, EU AI Act 또는 그 밖의 어떤 프레임워크로도 인증받지 않았고, 진행 중인 감사도 없습니다. 다만 이들 프레임워크가 검토하는 통제 목표에 매핑되도록 설계되어 있어, 추후 감사를 받을 준비가 되어 있습니다. 엔터프라이즈 조달을 위한 Data Processing Agreement(GDPR 제28조)는 요청 시 제공됩니다.

에이전트가 무엇에 접근할 수 있는지 확인하세요

Olivares AI는 당신의 AI 환경을 위한 개방형 자체 호스팅 플랫폼입니다. 자체 인프라에 배포하고 보안 및 플랫폼 팀이 필요로 하는 액세스 맵을 확보하세요.