지난 글에서는 AI Ready Data의 개념에 대해 알아보았는데요, 그 중 ODI의 "A framework for AI-ready data" 내용 중 프레임워크의 상세 가이드를 알아봅니다. 해당 보고서는 AI Ready Data 데이터 프레임워크를 데이터 속성(Dataset Properties), 메타데이터(Metadata), 주변 인프라(Surrounding Infrastructure)의 3가지 주요 범주로 나누고 있습니다.
각 범주의 상세 가이드는 다음과 같습니다. 1️ 데이터 속성(Dataset Properties) · 표준 준수: 국가 코드(ISO-3)나 시간 데이터(ISO-8601) 등 국제 표준을 따라야 합니다. · 의미적 일관성: '심장마비'와 '심정지'처럼 동의어인 경우 하나로 통일하여 AI의 혼란을 방지해야 합니다. · 불균형 식별: 데이터 내 특정 클래스나 출처가 쏠려 있는지 사용자가 쉽게 알 수 있어야 합니다. · 파일 형식: 유연한 CSV, 특히 AI 워크플로...
원문 링크 : AI Ready Data 프레임워크와 주요 동향