2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents
데이터가 이미 잘 규격화(타입, 크기 등) 되어있는 상황이라면 잘 마주하지 않을 문제이지만 현실의 많은 케이스에서는 데이터가 있긴하지만...중간 중간 뭔가 불완전한 요소들이 섞여들어가 있는 경우가 많습니다. 예를 들어 데이터프레임의 칼럼을 실수형으로 바꾸려고 하는데
ValueError("could not convert string to float: "")
과 같은 에러를 만나기도 합니다.
원본 데이터에 "$"(통화 값이 칼럼에 기록된 경우에 종종), ","와 같은 특수기호값이 섞여들어가거나
""와 같은 빈 문자열이 있을때 astype(float)가 작동하지 않습니다.
변환불가능한 값을 NaN처리해주는 pd.to_numeric(errors='coerce')를 사용하면 좋습니다.
df['amount'] = (
df['amount']
.str.replace(r'[$,]', '', regex=True)
.pipe(pd.to_numeric, errors='coerce')
)'프로그래밍 > Python 관련 정보' 카테고리의 다른 글
| [Python문제풀이-순차적처리] 삼송전자 주식 분석 (0) | 2025.12.18 |
|---|---|
| [Algorithm] Divide and Conquer (0) | 2025.12.17 |
| [Python문제풀이-Dynamic Promgramming/Symmetry] 새꼼달꼼장사 (3) | 2025.12.09 |
| [Python문제풀이-순차적 처리/Two Pointer]Trapping Rain Water (0) | 2025.12.07 |
| [Pandas] Indexing Multiple Rows/Columns (0) | 2025.11.28 |