Chapter 4.3 데이터 세트 품질 문제(Dataset Quality Issues) 품질 문제 <<---- 결함으로 연결될 수 있다. 잘못된 데이터 수집한 데이터가 부정확하거나(예 : 오류가 있는 센서에서 수집) 잘못 입력됨(예 : 복사-붙여넣기 오류) 불완전한 데이터 데이터 값이 누락될 수 있음(예 : 레코드의 특정 필드가 비어 있거나 특정 시간의 데이터가 누락되었을 수 있음).
불완전한 데이터의 원인은 보안 문제, 하드웨어 문제, 인적 오류 등 다양한 원인이 있을 수 있음. 잘못 라벨링 된 데이터 다양한 원인으로 데이터 라벨링이 잘못될 수 있음.
데이터 부족 사용 중인 학습 알고리즘에서 패턴을 인식하기에 데이터가 부족함(알고리즘에 따라 필요한 최소 데이터 품질이 달라질 수 있음). 전처리 되지 않은 데이터 데이터는 깨끗하고 일관된 형식을 가지며 원하지 않는 이상 값이 포함되지 않도록 전처리 되어야 함.
오래된 데이터 학습과 예측 모두에 사용되는 데이터는 가능한 최신 데이터이어...
#
AI
#
데이터
#
데이터라벨링
#
라벨링기법
#
라벨링접근법
#
머신러닝
#
요약
#
인공지능
#
자격증
#
주석
#
기계학습
#
공부
#
annotation
#
ISTQB
#
Mechinelearning
#
ML
#
QA
#
TE
#
Test
#
Tester
#
TL
#
품질문제