데이터분석 🔎

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 0: invalid start byte 오류

23.8 2022. 12. 31. 05:41
반응형

 

데이터 처리를 위하여 Pandas의 read_csv 함수로 다음과 같이 파일을 읽어오던 도중 아래의 오류를 만났습니다.

recipe_ingredient_csv = pd.read_csv('recipe_ingredient_info.csv')

 

error ↓

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 0: invalid start byte

 

처음에는 read_csv에서 encoding 형식을 utf8로 지정해주면 될 것이라고 생각하여 파라미터값으로 encoding='utf8'을 추가해줬지만 계속 같은 오류가 발생하였습니다.

recipe_ingredient_csv = pd.read_csv('recipe_ingredient_info.csv', encoding = 'utf8')

 

이럴때는 csv파일 자체가 utf-8로 인코딩이 되어있지 않기에 문제가 발생하는 것일 수 있습니다. 그렇기에 csv파일을 엑셀에서 열고 파일형식을 아래와 같이 csv utf-8로 지정하여 저장해 주었더니 오류가 해결되었습니다 :)

 

 

728x90
반응형