본문 바로가기
728x90
반응형

series3

Series : 1D data구조 for Pandas Seriespandas의 1D data를 위한 핵심 데이터 구조인덱스(index)와 값(value)으로 구성된 labeled 1차원 데이터 구조를 관리Index : 각 데이터 포인트의 레이블흔히, 0부터 시작하는 정수 index로 접근: .iloc또는 명시적으로 할당된 label을 통해 접근: .locValue : 실제 데이터 값모든 값은 동일한 데이터 타입(dtype)을 가짐선택적으로 Series는 name 속성을 가질 수 있음 (Series를 가리키는 이름임.)참고로 DataFrame은 2D labeled tabular data structure로, 여러 개의 Series가 열(column)로 결합된 형태라고 볼 수 있음. 즉, DataFrame의 각 column은 하나의 Series임.1. Seri.. 2025. 10. 3.
[Pandas] 차트 그리기-plot DataFrame Plot 주요 차트Line/Bar/Area : trend & 비교Hist/Box : 분포Scatter : 상관관계Pie : 비율DataFrame.plot.* 과 Series.plot.*는 같은 백엔드(matplotlib)를 사용.line, bar, barh, hist, box, area, pie는 Series에도 동일하게 사용 가능.단, scatter는 Series에는 없음 (왜냐하면 scatter는 최소 2개 축(x, y)이 필요하기 때문).아래에 나온 방식외에도 다음의 방식도 사용되기도함:# df.iloc[:20, :4].plot(title="Default df.plot() = Line Plot")df.plot(kind="line") # 선 그래프 (기본값)df.plot(k.. 2025. 9. 5.
[Pandas] unique(), value_counts(), nunique() 범주형(categorical) 데이터 전처리 상황에서 많이 사용되는 메서드들임. 종류가 적은 값을 가지는 데이터들을 분석하는데 주로 이용됨.unique(): 고유값 배열 반환.value_counts(): 고유값과 빈도 를 확인 가능케 함.nunique(): 고유값 개수를 반환.범주형 데이터에는 예상치 못한 값이 섞여 있을 수 있으므로 반드시 확인 후 Data Cleaning이 필요0. Create Sample DataFrame (샘플 DataFrame 생성)import pandas as pd# DataFrame 생성data = { "Name": ["Alice", "Bob", "Charlie", "Alice", "David", "Bob"], "Gender": ["Female", "Male", ".. 2025. 8. 23.
728x90
반응형