본문 바로가기
728x90
반응형

DataFrame3

[Pandas] 차트 그리기-plot DataFrame Plot 주요 차트Line/Bar/Area : trend & 비교Hist/Box : 분포Scatter : 상관관계Pie : 비율DataFrame.plot.* 과 Series.plot.*는 같은 백엔드(matplotlib)를 사용.line, bar, barh, hist, box, area, pie는 Series에도 동일하게 사용 가능.단, scatter는 Series에는 없음 (왜냐하면 scatter는 최소 2개 축(x, y)이 필요하기 때문).아래에 나온 방식외에도 다음의 방식도 사용되기도함:# df.iloc[:20, :4].plot(title="Default df.plot() = Line Plot")df.plot(kind="line") # 선 그래프 (기본값)df.plot(k.. 2025. 9. 5.
[Pandas] DataFrame 생성-다른 데이터 타입의 객체로부터 DataFramepandas의 핵심 데이터 구조엑셀 시트처럼 행(row)과 열(column)으로 구성된 labeled 2차원 tabular data를 관리Row : a case of sample (=single instance)흔히, 0부터 시작하는 index를 통해 접근: .iloc또는 index로 할당된 label을 통해 접근: .locColumn : a feature(or attribute).DataFrame 에서 각각의 Column은 문자열 이름을 가진 Series 라고 볼 수 있음.참고로 Series 는 1D labeled data structure로 하나의 row 또는 하나의 column을 추상화하고 있는 클래스임.참고사항 0 :pandas 2.0부터는DataFrame.append()와 Ser.. 2025. 8. 21.
[Term] pivot 이란? 1. pivot 이란?Pandas에서 pivot은 데이터의 모양(shape)을 바꾸는 기능 을 가리킴: reshaping특정 column의 값들을 row 인덱스(index)로,또 다른 column의 값들을 열(columns)로지정하는 테이블을 만들고,해당 조합(index와 columns의 값들의 조합) 대응되는 또 다른 column 값을 값(values)으로 재배치.이는 long format이라고 불리는 형태의 테이블(하나의 observation이 여러 행에 걸쳐 표시됨.)을 wide format이라고 불리는 형태(하나의 observation이 하나의 row(=record)로 표시됨.)로 바꾸어줌.Pandas 에서는 DataFrame의 클래스의 메서드로pivot() 메서드와pivot_table() 메서드.. 2025. 8. 20.
728x90
반응형