본문 바로가기

프로그래밍/Python 관련 정보67

[Pandas] drop_duplicates 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents중복을 제거하는 Drop_duplicates에 대해서 간단히 정리하겠습니다.  (1) SyntaxDataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False) (2) 주요인자subset=None (Default)중복을 판단할 특정 컬럼을 지정 (기본값: None, 즉 모든 컬럼 기준)keep= 'first' (Default) 어느 행을 유지할지 선택: 'first', 'last'inplace= False (Default) True이면 원본 DataFrame을 직접 수정ignore_index=FalseT.. 2025. 2. 23.
[Pandas] update 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of ContentsPandas 데이터프레임을 말 그대로 새로운 값으로 update 해주는 method가 Update입니다.  (1) Sytax DataFrame.update(other, join='left', overwrite=True, filter_func=None, errors='raise') (2) 입력인자(Arguments )other (필수)업데이트할 데이터를 포함하는 다른 DataFrame을 지정합니다.인덱스와 컬럼이 일치하는 경우 해당 위치의 값이 업데이트됩니다.overwrite=True (Default)True: NaN을 포함한 값을 덮어씌웁니다.False: 기존 값이 NaN이 아닌 경우에는 덮어씌.. 2025. 2. 23.
[Pandas] sort_index() / sort_values() 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contentssort_index() → 인덱스를 기준으로 정렬 sort_values() → 특정 열(column)의 값을 기준으로 정렬 1. sort_index()(1) SyntaxDataFrame.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True, key=None) (2) 입력인자axis=0 (Default) 0: 행 인덱스 기준 (기본값) / 1: 열 인덱스 기준level=None (Default) 멀티인덱스(MultiIndex)에.. 2025. 2. 23.
[Pandas] nlargest/nsmallest 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of ContentsSyntax는 아래와 같습니다. DataFrame.nlargest(n, columns, keep='first')DataFrame.nsmallest(n, columns, keep='first') keep 옵션은 'first', 'last', 'all' 중 하나로 줄 수 있으며 n번째 데이터가 중복일 때 어떤 것을 리턴할 지 입력받는 argument입니다.  df2 = pd.DataFrame({'A': [10, 20, 20, 30, 30, 30], 'B': ['a', 'b', 'c', 'd', 'e', 'f']})# 기본적으로 첫 번째 3개만 반환print(df2.nlargest(3, 'A'))# .. 2025. 2. 22.
[Python 기초] Broadcasting 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of ContentsBoradcasting 에 대해서는 다들 많이 아실텐데 좀 정확하게 정리를 한 번 해보겠습니다. Rule1. 총 차원의 개수가 맞지 않는 경우 차원을 확장시켜줍니다. 이 때, 앞에 있는 차원을 열어주고 그 차원의 크기는 1로 만들어줍니다. Rule2. 총 차원의 개수는 동일하지만 개별 차원의 크기가 동일하지 않을 때 차원의 크기를 늘려줄 수 있습니다. 단, 연산에 참여하는 배열의 차원의 크기가 1이어야 합니다.  말로는 쉽게 요약해보려고 해도 어렵네요.. 예시를 보면서 이해해봅시다. 예시 1: (3, 1) + (3,) → (3, 3)import numpy as np# (3, 1) 형태의 배열 생.. 2025. 2. 22.
[Pandas] idxmax(), idxmin() 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents명령어 자체는 직관적인 명령어 입니다. 특정한 칼럼 기준으로 최대, 최소값을 갖도록하는 index를 찾은 후 그 index에 대응되는 다른 칼럼의 값을 찾을 때 사용할 수 있습니다. SQL에서 Keep을 이용한 용법과 유사한 측면이 있다고 볼 수 있겠네요. import pandas as pd# Series 예시s = pd.Series([3, 7, 2, 9, 1])print(s.idxmax()) # 결과: 3 (인덱스 3에서 최대값 9)# DataFrame 예시df = pd.DataFrame({ 'A': [1, 5, 3], 'B': [4, 2, 6], 'C': [7, 8, 5]}.. 2025. 2. 20.
728x90