프로그래밍/Python 관련 정보
[Pandas] drop_duplicates
물박사의 저장공간
2025. 2. 23. 12:43
2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents
중복을 제거하는 Drop_duplicates에 대해서 간단히 정리하겠습니다.
(1) Syntax
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
(2) 주요인자
- subset=None (Default)
중복을 판단할 특정 컬럼을 지정 (기본값: None, 즉 모든 컬럼 기준) - keep= 'first' (Default)
어느 행을 유지할지 선택: 'first', 'last' - inplace= False (Default)
True이면 원본 DataFrame을 직접 수정 - ignore_index=False
True이면 새로운 인덱스를 부여
(3) 예시
df_unique = df.drop_duplicates(subset=['A']) # A 컬럼만 기준으로 중복 판별
print(df_unique)