2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents
중복을 제거하는 Drop_duplicates에 대해서 간단히 정리하겠습니다.
(1) Syntax
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
(2) 주요인자
- subset=None (Default)
중복을 판단할 특정 컬럼을 지정 (기본값: None, 즉 모든 컬럼 기준) - keep= 'first' (Default)
어느 행을 유지할지 선택: 'first', 'last' - inplace= False (Default)
True이면 원본 DataFrame을 직접 수정 - ignore_index=False
True이면 새로운 인덱스를 부여
(3) 예시
df_unique = df.drop_duplicates(subset=['A']) # A 컬럼만 기준으로 중복 판별
print(df_unique)
'프로그래밍 > Python 관련 정보' 카테고리의 다른 글
[Pandas] Rank (0) | 2025.02.23 |
---|---|
[Pandas] select_dtypes() (0) | 2025.02.23 |
[Pandas] update (0) | 2025.02.23 |
[Pandas] sort_index() / sort_values() (0) | 2025.02.23 |
[Pandas] nlargest/nsmallest (0) | 2025.02.22 |