[Pandas] index 와 columns- 관련 메서드: rename(), set_index(), reset_index()
DataFrame과 Series의 index, DataFrame의 columnsSeries.index, DataFrame.index, DataFrame.columns는 모두 pandas.Index 객체로, 각각 row labels 또는 column labels의 집합을 나타냄.이들은 immutable하여 개별 원소 수정은 불가능하지만,새로운 Index 객체로 전체 교체가 가능하며,집합 연산(union, intersection 등)등을 지원함.1. Series객체의 index 속성정의: Series의 row labels 를 담는 객체자료형: pandas.Index특징:immutable 성질을 가지므로 개별 원소 수정은 불가하지만 새로운 Index 객체로 전체 교체는 가능집합 연산 지원 (교집합, 합집합 등..
2025. 8. 24.
[Pandas] unique(), value_counts(), nunique()
범주형(categorical) 데이터 전처리 상황에서 많이 사용되는 메서드들임. 종류가 적은 값을 가지는 데이터들을 분석하는데 주로 이용됨.unique(): 고유값 배열 반환.value_counts(): 고유값과 빈도 를 확인 가능케 함.nunique(): 고유값 개수를 반환.범주형 데이터에는 예상치 못한 값이 섞여 있을 수 있으므로 반드시 확인 후 Data Cleaning이 필요0. Create Sample DataFrame (샘플 DataFrame 생성)import pandas as pd# DataFrame 생성data = { "Name": ["Alice", "Bob", "Charlie", "Alice", "David", "Bob"], "Gender": ["Female", "Male", "..
2025. 8. 23.