프로그래밍/Python 관련 정보

[Pandas] drop_duplicates

물박사의 저장공간 2025. 2. 23. 12:43

2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents


중복을 제거하는 Drop_duplicates에 대해서 간단히 정리하겠습니다. 

 

(1) Syntax

DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)

 

(2) 주요인자

  • subset=None (Default)
    중복을 판단할 특정 컬럼을 지정 (기본값: None, 즉 모든 컬럼 기준)
  • keep= 'first' (Default)
    어느 행을 유지할지 선택: 'first', 'last'
  • inplace= False (Default)
    True이면 원본 DataFrame을 직접 수정
  • ignore_index=False
    True이면 새로운 인덱스를 부여

 

(3) 예시

df_unique = df.drop_duplicates(subset=['A'])  # A 컬럼만 기준으로 중복 판별
print(df_unique)