pandas-profiling 패키지를 이용하면, pandas 자료에 대한 일반적인 특징들을 자동으로 정리한 결과를 얻을 수 있다. 먼저 설치하고, 아래와 같이 패키지에서 함수를 부른 다음, 분석할 파일을 함수에 넣어주고 결과내용을 저장하면 된다.
결과를 살펴보면 변수에 대한 정보, 변수간 상관관계, 결측치(missing data) 현황등 여러가지 유용한 정보들을 한번에 제공 받을 수 있다. (본 결과들은 DACON 신용카드 사용자 연체 예측 경진대회 데이터를 사용했습니다.)...
Pandas, 자동으로 데이터 핵심 EDA 내용 정리 (pandas-profiling)에 대한 요약내용입니다.
자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.