로딩
요청 처리 중입니다...

[데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩

 [데이터 분석][Python] 파일 읽기 오류 - read_csv UnicodeDecodeError 'cp949' 'utf-8' codec can't decode byte 인코딩

우리가 파이썬에서 데이터를 읽어 올 때 에러가 나는 경우를 종종 볼 수 있습니다. 아래와 같이 판다스의 read_csv() 함수로 csv 파일을 읽어왔는데, 에러가 뜹니다.

에러의 제일 아래쪽을 보니, UnicodeDecodeError: 'utf-8' codec can't decode byte 0x85 in position 3375: invalid start byte 라는 메시지가 보이네요. 원인은 read_csv() 함수가 기본적으로 encoding이 utf-8로 세팅 되어 있는데, 파일이 utf-8로 읽을 수 없다는 내용입니다.

구글링을 해 보면 많은 분들이 'cp949' 로 바꿔보면 된다 라고 하십니다. 그래서 저도 한번 encoding을 'cp949'로 바꿔봤습니다.

그래도 여전히 유사한 에러가 나옵니다. UnicodeDecodeError: 'cp949' codec can't decode byte 0x80 in position 24483: illegal multibyte se...

# ANSI # 데이터 # 데이터읽기 # 디코딩 # 분석 # 아스키 # 오류 # 인코딩 # 코덱 # 파이썬 # utf # unicodedecodeerror # read_csv # ascii # codec # cp949 # encode # error # euckr # notepad # pandas # python # 판다스