[%%IMAGE1%%]

데이터에 노이즈 주입하면 민감정보가 비식별화된다?

네이버의 전략투자 조직인 디투에스에프(D2SF)가 5일 생성·비식별화 기술 스타트업 큐빅에 지분투자를 하면서 “국내에서 보기 드문 ‘차등정보보호’ 기술이 탐나서”라고 설명해, 차등정보보호(Differential Privacy) 기술이 무엇인지에 관심이 모아지고 있다.

네이버 설명에 따르면, 차등정보보호 기술은 데이터에 노이즈(방해요소)를 주입해 민감정보를 비식별화하는 것이다. 세계적으로 초거대 인공지능(AI) 기술 활용 경쟁이 심화하는 가운데, 이 기술이 데이터를 보호하고, 조직·기업 간 데이터를 공유하지 못하는 ‘사일로’ 현상을 효과적으로 해소할 수 있는 솔루션으로 주목을 받고 있다.

애플·아마존·페이스북 같은 글로벌 빅테크 기업들은 이미 자체적으로 이 기술을 솔루션화해 서비스에 적용 중이다. 반면 국내엔 이 기술 개발에 성공했거나 솔루션화한 사례가 드물다. 네이버는 “큐빅은 차등정보보호 기술을 인공지능 모델에 적용해 원본 데이터와 유사도가 높으면서도 민감정보 노출 위험을 낮춘 데이터 생성 솔루션 개발에 성공해 탄탄한 기술력을 입증했다”며 “협력 시너지 효과가 클 것으로 판단해 지분투자를 했다”고 설명했다.

배호 큐빅 대표는 인공지능 데이터 프라이버시 기술 분야의 다양한 프로젝트에 참여해본 차등정보보호 기술 전문가다. 2021년 큐빅을 창업했다. 지금은 ‘네이버 D2SF@강남’에 입주해, 기술 고도화와 사업화에 힘쓰고 있다. 큐빅은 여러 기업·기관과 손잡고 데이터 전처리부터 후가공까지를 모두 자동화한 인공지능 데이터 공유·분석 플랫폼 개발·구축 중으로, 내년 초 본격 사업에 나설 계획이다.

양상환 네이버디투에스에프 리더는 “초거대 인공지능 모델에 기반한 데이터·콘텐츠 생산이 활발해지고 있지만, 원본 데이터가 쉽게 유추될 경우 데이터 프라이버시 문제로 직결될 수밖에 없다”며 “큐빅은 그동안 민감정보나 기업 보안 등의 이슈에 갇혀있던 데이터를 활용할 수 있는 자원으로 만들었다. 안전한 생성형 인공지능을 만드는데 필수적인 솔루션으로 자리잡을 것으로 본다”고 말했다.

앞서 네이버는 데이터를 안전하게 분석·활용할 수 있는 기반 기술에 주목해, 동형 암호 기반의 데이터 분석 스타트업 ‘디사일로’에도 지분투자를 한 바 있다.

김재섭 선임기자 jskim@hani.co.kr