데이터는 있지만, 쓰기 어려운 현실 공공데이터는 매 해 꾸준히 개방되어 오고 있습니다. 하지만 정작 현장에서는 “공공데이터를 활용하기가 쉽지 않다” 라는 목소리가 반복됩니다.
실제로 최근 정부가 주재한 제 1차 핵심 규제 합리화 전략회의에서도 현장의 어려움이 드러났습니다. 한 AI 기업의 대표는 다음과 같은 어려움을 직접 언급했습니다.
정부에서 AI 학습에 사용하라고 개방한 공공데이터를 보니, 안에는 내용이 없는 ‘빈 곽’이었습니다. 무슨 데이터인지 식별조차 안 돼 사용할 수가 없습니다.
(출처: 한국기자협회, '데이터라고 다 같은 것이 아니다') 이러한 어려움의 근본적인 원인은 개인정보 보호를 최우선으로 하는 제도적 환경과 기존 비식별화 방식의 기술적 한계에 있습니다. 많은 공공데이터는 국민의 삶과 직결된 민감한 정보를 포함하고 있어, 외부 제공이나 분석 활용에 매우 신중할 수밖에 없습니다.
기존 방식대로 개인정보를 가리거나 삭제하더라도, 남은 정보들을 조합해 특정 개인을 알아내는...