2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents
value_counts() 메서드는 고유한 값들의 개수를 세는 기능을 제공합니다. 주로 카테고리형 데이터에서 값의 빈도수를 계산할 때 유용하게 사용됩니다. 예를 들어, 설문조사에서 각 응답의 빈도를 파악하거나, 특정 컬럼에 대한 고유한 값의 빈도를 계산할 때 사용합니다.
(1) Syntax
Series.value_counts(normalize=False, sort=True, ascending=False, bins=None, dropna=True)
(2) 입력인자
- normalize=False
비율로 계산할지 여부 (True: 빈도수 대신 비율로 계산) - sort=True
빈도수를 기준으로 정렬할지 여부 (True: 빈도수 내림차순 정렬) - ascending=False
오름차순/내림차순 여부 (True: 오름차순, False: 내림차순) - bins=None
값들을 구간(bins)으로 나눠서 빈도수 계산 (숫자형 데이터에서 사용) - dropna=True
NaN 값을 포함할지 여부 (True: NaN 제외, False: NaN 포함)
(3) 예시
# 숫자형 데이터로 구간별 빈도수 계산
numeric_data = pd.Series([1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 6])
value_counts_bins = numeric_data.value_counts(bins=3)
print(value_counts_bins)
(0.996, 2.667] 2
(2.667, 4.333] 4
(4.333, 6.0] 5
dtype: int64
'프로그래밍 > Python 관련 정보' 카테고리의 다른 글
[Pandas] Advanced Indexing - Boolean vector (0) | 2025.02.23 |
---|---|
[Pandas] fillna (0) | 2025.02.23 |
[Pandas] Rank (0) | 2025.02.23 |
[Pandas] select_dtypes() (0) | 2025.02.23 |
[Pandas] drop_duplicates (0) | 2025.02.23 |