본문 바로가기

pandas31

[Pandas] explode Pandas의 explode() 함수는 이름 그대로 '폭발시키다'는 의미를 담고 있습니다. 데이터 분석을 하다 보면 한 셀 안에 리스트나 튜플 같은 데이터가 뭉쳐 있어 처리가 곤란할 때가 있는데, 이때 explode()를 사용하면 유용합니다. 예를 들어 아래 예시를 볼까요?import pandas as pd# 1. 예시 데이터 생성data = { '상품명': ['티셔츠', '청바지', '원피스', '운동화', '에코백'], '태그': ['여름,기본,화이트', '데님,사계절', '여름,데이트,꽃무늬', '기본,런닝,운동', '기본,화이트,에코']}df = pd.DataFrame(data)print("--- 원본 데이터 ---")print(df) 이런 데이터가 있다고 해봅시다. 그리고 우리는 .. 2026. 3. 22.
[Pandas] Apply 함수 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of ContentsApply 함수에 대해서 정리해보도록 하겠습니다. Apply method에서 중요한 점 중 하나는 Series에서 적용할 때와 DataFrame에서 적용할 때의 차이점을 인지하는 것이라 생각합니다. 1. apply의 입력인자Seires.apply 의 경우 : 이 때는 apply에 적용하는 함수의 input으로 해당하는 series(column)의 각 value(값)이 들어가게 됩니다. DataFrame.apply 의 경우 : 이 때는 apply에 적용하는 함수의 input으로 axis에 따른 series가 들어가게 됩니다. 표로 정리하면, 아래와 같습니다입력인자apply를 통해 적용되는 함수의.. 2025. 7. 19.
[Pandas] 사용자 정의 정렬하기 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents대부분의 경우에는 크기 순, 알파벳 순 등으로 해주면 되는데 가끔은 내가 정의한 대로 해주어야 할 때도 있습니다. 저 같은 경우에는 데이터프레임에서 선형방정식 (행렬) 을 푸는데 행, 열의 위치를 그전 계산값의 정렬과 일치시켜주어야 했습니다. Pandas에서는 pd.categorical 자료형을 활용하는 게 가장 간단하다고 하는데요import pandas as pd# 예제 데이터df = pd.DataFrame({ 'GC': ['A', 'B', 'C', 'D', 'B', 'A', 'C', 'D'], 'Value': [10, 20, 30, 40, 15, 25, 35, 45]})# 사용자.. 2025. 5. 16.
[Pandas 기초] - Cross Join이 필요할 때 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents사실 저는 Cross join이 그렇게 필요한가? 라는 생각을 했었는데요... cross join은 다음 예와 같이 모든 카테고리의 조합을 계산(테이블에 정보가 없어서 Null 혹은 0을 넣는 한이 있어도)해야하는 경우에 사용합니다. https://leetcode.com/problems/students-and-examinations/?envType=study-plan-v2&envId=30-days-of-pandas&lang=pythondata 제가 처음에 작성했던 솔루션은 아래와 같았습니다. def students_and_examinations(students: pd.DataFrame, sub.. 2025. 4. 30.
[Pandas 기초] Series의 칼럼명 변경 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents저는 데이터프레임의 칼럼명을 변경할 때 rename({old_name:new_name}, axis=1) 과 같은 형식으로 바꾸곤 하는데요, 만약 데이터프레임이 아니라 Series일 경우에는 어떻게 변경하면 될까요? 1. name 속성에 직접 접근해서 변경s.name = "new_name" 2. rename() 매서드를 이용해서 변경s_renamed = s.rename("new_name") 2025. 4. 28.
[Pandas 기초] DataFrame 집계 method 2025.02.24 - [프로그래밍/Python 관련 정보] - [Pandas] Table of Contents이번 포스팅에서는 결과물의 차원에 초점을 두고 DataFrame의 집계 method에 대해서 알아보도록 하겠습니다. 사실 집계 method로 분류되는 것들이 따로 있다기보다는 데이터프레임의 method에 집계 기능이 있는 method가 존재하는 것인데요, method들의 결과물은 당연하게도 어떤 method냐에 따라 다양한 shape으로 나올 수 있습니다.더보기df = pd.DataFrame({ 'A': ['x','x','y','y','z'], 'v1':[1,2,3,4,5], 'v2':[10,20,30,40,50]}) 1. 축소(Reduction)결과가 그룹 수 혹은 컬럼 수만큼.. 2025. 4. 27.
반응형