로딩
요청 처리 중입니다...

비정형 데이터 품질관리는 어떻게 해야할까?

 비정형 데이터 품질관리는 어떻게 해야할까?

우리가 사용하는 데이터는 크게 '정형 데이터' 와 '비정형 데이터' 로 구분이 가능합니다. 현재 공공데이터 품질관리 수준평가에서는 보통 '정형 데이터' 를 기준으로 품질관리 수준평가가 이루어지고 있는데요.

사실 우리가 많이 사용하는 '비정형 데이터' 의 품질관리도 당연히 필요합니다. 그렇다면 '비정형 데이터' 는 어떻게 품질을 관리하면 좋을까요?

Step 1. '비정형 데이터' 란?

우선, 첫 번째로 '비정형 데이터' 의 정의는 무엇인가 알아보는 시간을 가지겠습니다. 비정형 데이터란?

"정의된 구조가 없이 정형화되지 않은 데이터" 비정형 데이터는 “사전 정의된 특정한 데이터 구조가 없어 규격화된 데이터 필드에 저장되지 않는 데이터”를 말합니다. 즉, 표(행·열)처럼 딱 정해진 칸에 넣는 데이터라기보다, 텍스트·문서·이미지·음성·동영상·공간정보처럼 파일(콘텐츠) 자체가 중심인 데이터입니다.

대표적인 비정형 데이터에는 동영상 파일, 오디오 파일, 사진, 보고서(문서), 메일 본문 등이 ...