이제 본격적인 작업에 들어가 볼까요? 1편에서 준비 과정을 살펴봤다면, 이번에는 실제로 데이터를 가명화하거나 합성데이터를 생성하는 과정을 자세히 알아보겠습니다.
이 단계가 가장 기술적이면서도 신중해야 하는 부분이에요. 가명화 작업 진행하기 체계적인 접근이 핵심 가명화는 단순히 이름을 번호로 바꾸는 것 이상의 작업입니다.
어떤 정보를 어떻게 처리할지 체계적으로 접근해야 해요. 주요 기법들 치환(Substitution): 개인 식별 정보를 무작위 값으로 바꾸기 삭제(Suppression): 꼭 필요하지 않은 민감 정보 완전 제거 범주화(Generalization): 구체적인 정보를 더 넓은 범주로 묶기 예: 1987년 3월 15일 → 1980년대 또는 40대 예: 서울시 강남구 역삼동 → 서울시 강남구 가명화 키 관리, 이것만큼은 꼭!
가명화 과정에서 원본과 가명 정보를 연결하는 키가 생성됩니다. 이 키는 정말 중요한 정보라서 다음과 같이 관리해야 해요: 권한이 있는 최소한의 인원만 접...
원문 링크 : 공공데이터 개방 시리즈 2편: 가명화와 합성데이터 생성