반응형
데이터 처리를 위하여 Pandas의 read_csv 함수로 다음과 같이 파일을 읽어오던 도중 아래의 오류를 만났습니다.
recipe_ingredient_csv = pd.read_csv('recipe_ingredient_info.csv')
error ↓
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb7 in position 0: invalid start byte
처음에는 read_csv에서 encoding 형식을 utf8로 지정해주면 될 것이라고 생각하여 파라미터값으로 encoding='utf8'을 추가해줬지만 계속 같은 오류가 발생하였습니다.
recipe_ingredient_csv = pd.read_csv('recipe_ingredient_info.csv', encoding = 'utf8')
이럴때는 csv파일 자체가 utf-8로 인코딩이 되어있지 않기에 문제가 발생하는 것일 수 있습니다. 그렇기에 csv파일을 엑셀에서 열고 파일형식을 아래와 같이 csv utf-8로 지정하여 저장해 주었더니 오류가 해결되었습니다 :)
728x90
반응형
'데이터분석 🔎' 카테고리의 다른 글
[데이터 분석 라이브러리] 파이썬 판다스 Series, DataFrame (0) | 2022.11.25 |
---|---|
[데이터 분석을 위한 라이브러리] 파이썬 numpy, numpy와 list차이 (0) | 2022.11.24 |
[데이터 분석을 위한 라이브러리] 파이썬 모듈이란? (0) | 2022.11.24 |
데이터 분석을 위한 라이브러리 (0) | 2022.11.24 |
geopandas 설치 에러 - python setup.py egg_info Check the logs for full command output, failed with initial frozen solve. Retrying with flexible solve. (3) | 2021.08.09 |