본문 바로가기
프로그래밍/Python 관련 정보

[Pandas] drop_duplicates

by TrillionNT 2025. 2. 23.

2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents


중복을 제거하는 Drop_duplicates에 대해서 간단히 정리하겠습니다. 

 

(1) Syntax

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

 

(2) 주요인자

  • subset=None (Default)
    중복을 판단할 특정 컬럼을 지정 (기본값: None, 즉 모든 컬럼 기준)
  • keep= 'first' (Default)
    어느 행을 유지할지 선택: 'first', 'last'
  • inplace= False (Default)
    True이면 원본 DataFrame을 직접 수정
  • ignore_index=False
    True이면 새로운 인덱스를 부여

 

(3) 예시

df_unique = df.drop_duplicates(subset=['A'])  # A 컬럼만 기준으로 중복 판별
print(df_unique)

'프로그래밍 > Python 관련 정보' 카테고리의 다른 글

[Pandas] Rank  (0) 2025.02.23
[Pandas] select_dtypes()  (0) 2025.02.23
[Pandas] update  (0) 2025.02.23
[Pandas] sort_index() / sort_values()  (0) 2025.02.23
[Pandas] nlargest/nsmallest  (0) 2025.02.22