안녕하세요, MoonLight입니다. Pandas의 read_csv로 CSV file을 읽거나 혹은 Text 기반의 파일을 python에서 읽으려고 할 때, "UnicodeDecodeError 'utf-8' codec can't decode byte 0x~~ in position ~ invalid start byte"라는 Error를 종종 만나곤 합니다.
대부분 한글을 포함하거나 python에서 읽을 수 없는 특수 문자들이 포함된 경우인데, 이를 해결할 수 있는 방법들에 대해서 알아보겠습니다. 1. Encoding 방식 변경 read_csv()등과 같이 File Open함수에 encoding parameter를 다른 방식으로 바꾸는 방법입니다. df = pd.read_csv("Encoding_Error_Test.csv",encoding='utf-8') 위와 같이 utf-8로 읽으면 Error가 발생했으므로, 다른 Encoding 방식으로 변경해 봅니다.
대표적으로, 'cp949'와 ...
#
byte
#
UnicodeDecodeError
#
UltraEdit
#
start
#
read_csv
#
python
#
position
#
open
#
invalid
#
excel
#
decode
#
csv
#
codec
#
cant
#
utf8