소프트웨어/python

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbb in position 0: invalid start byte

개발자_이훈규 2020. 2. 12. 08:03

 

python에서 pandas의 read_csv을 하다가 만난 에러이다.

한글의 경우 utf-8, utf-16, euc-kr 등으로 인코딩이 된 파일이 있는데 이 중에 하나의 encoding으로 설정해야지 해당 에러가 안나오고 글자가 잘 읽어온다.

 

여러 블로그에서 본 것 중에 필자는 CP494로 해결이 되었다.

 

pd.read_csv("path.csv", encoding = 'CP949')

 

CP494 란 한글 인코딩의 한 종류이며 EUC-KR의 한 종류이다.

https://namu.wiki/w/CP949

 

CP949으로 해결이 안되면 다른 종류의 encoding을 시도해보면 좋다