본문 바로가기

프로그래밍/Python 관련 정보

[Pandas] drop_duplicates

by 물박사의 저장공간 2025. 2. 23.

2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents

중복을 제거하는 Drop_duplicates에 대해서 간단히 정리하겠습니다.

(1) Syntax

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

(2) 주요인자

subset=None (Default)
중복을 판단할 특정 컬럼을 지정 (기본값: None, 즉 모든 컬럼 기준)
keep= 'first' (Default)
어느 행을 유지할지 선택: 'first', 'last'
inplace= False (Default)
True이면 원본 DataFrame을 직접 수정
ignore_index=False
True이면 새로운 인덱스를 부여

(3) 예시

df_unique = df.drop_duplicates(subset=['A'])  # A 컬럼만 기준으로 중복 판별
print(df_unique)

'프로그래밍 > Python 관련 정보' 카테고리의 다른 글

[Pandas] Rank (0)	2025.02.23
[Pandas] select_dtypes() (0)	2025.02.23
[Pandas] update (0)	2025.02.23
[Pandas] sort_index() / sort_values() (0)	2025.02.23
[Pandas] nlargest/nsmallest (0)	2025.02.22

티스토리툴바