728x90 반응형 pandas31 [Pandas] .map() 과 .apply() 메서드 1) DataFrame.map() 메서드: element-wise(요소 단위) 적용목적:DataFrame의 각 스칼라 요소에 함수를 적용element-wise 변환.반환:입력과 동일한 shape의 DataFrame.주요 파라미터func: 각 요소에 적용할 함수(호출 가능 객체).na_action='ignore': 결측값(NA)에는 함수를 적용하지 않음.na_action=None:기본값으로, 이 경우 NA값에도 함수 적용이 되며,보통 NaN이 반환되지만 에러가 날 수도 있음.비고:이전에 사용되던 applymap은 deprecated.새 코드에서는 반드시 map 사용해야 함.import pandas as pdimport numpy as npdf = pd.DataFrame({"A": [1, 2, np.nan].. 2025. 8. 20. [Pandas] groupby() 메서드 groupby() 메서드는 DataFrame의 데이터를 하나 이상의 키를 기준으로 그룹화(grouping) 하여, 각 그룹에 대해 집계(aggregation)·변환(transform)·필터(filter) 연산을 적용할 수 있게 해주는 도구임.Split–Apply–Combine 패턴: 데이터를 나누고(split) → 그룹별 연산을 적용(apply) → 결과를 결합(combine)groupby 자체는 DataFrameGroupBy 또는 SeriesGroupBy 객체를 반환하며, 집계(aggregation), 변환(transform), 필터(filter) 같은 후속 연산(주로 aggregate function임)이 필요참고로, DataFrameGroupBy의 obj 속성은 대상이 되었던 원본 데이터프레임을 가.. 2025. 8. 20. [Term] pivot 이란? 1. pivot 이란?Pandas에서 pivot은 데이터의 모양(shape)을 바꾸는 기능 을 가리킴: reshaping특정 column의 값들을 row 인덱스(index)로,또 다른 column의 값들을 열(columns)로지정하는 테이블을 만들고,해당 조합(index와 columns의 값들의 조합) 대응되는 또 다른 column 값을 값(values)으로 재배치.이는 long format이라고 불리는 형태의 테이블(하나의 observation이 여러 행에 걸쳐 표시됨.)을 wide format이라고 불리는 형태(하나의 observation이 하나의 row(=record)로 표시됨.)로 바꾸어줌.Pandas 에서는 DataFrame의 클래스의 메서드로pivot() 메서드와pivot_table() 메서드.. 2025. 8. 20. [Pandas] pivot_table() 메서드 .pivot()과 같이 reshaping이 가능한 메서드.차이점은 .pivot()은 pivot 결과 테이블의 행-열 조합에서 중복되는 요소가 있는 경우 에러가 발생하나,.pivot_table()은 aggregation을 통한 하나의 대표값으로 처리가 가능함.groupby+aggregation+unstack 조합에 대한 일종의 syntactic sugar임.2025.08.20 - [Python] - [Term] pivot 이란? [Term] pivot 이란?1. pivot 이란?Pandas에서 pivot은 데이터의 모양(shape)을 바꾸는 기능 을 가리킴: reshaping특정 column의 값들을 row 인덱스(index)로,또 다른 column의 값들을 열(columns)로지정하는 테이블을 만들고,해.. 2025. 8. 19. [ML] pandas.DataFrame 에서 EDA에 적합한 메서드 요약 Pandas DataFrame에서 탐색적 데이터 분석(EDA)에 사용할 수 있는 주요 메서드들은 다음과 같음:2024.05.18 - [분류 전체보기] - [ML] Exploratory Data Analysis (EDA) [ML] Exploratory Data Analysis (EDA)Exploratory Data Analysis (탐색적 데이터 분석, EDA)EDA(탐색적 데이터 분석)은 실험 또는 데이터 프로젝트에서 데이터를 분석하는 첫 번째 단계임.EDA를 통해 분석가들은 데이터를 이해하고, 가설을 세ds31x.tistory.com1. 기본 정보 확인df.head(), df.tail() - 데이터의 처음/끝 부분 보기df.shape - 행과 열의 수 확인df.info() - 데이터 타입과 결측치 정보.. 2025. 5. 16. [DL] Pandas 로 csv 읽기: read_csv() pd.read_csv()comma-separated values (csv)파일을 읽어서pandas의 DataFrame 인스턴스로 변환해줌.URL을 통해서도 쉽게 DataFrame 객체를 얻을 수 있음.import pandas as pd# ----------------------# original data: boston house price data.# 'http://lib.stat.cmu.edu/datasets/boston'# original data의 경우, 1개의 sample에 2개의 행이 할당되어# 이에 대한 처리가 필요함.data_url = 'https://blog.kakaocdn.net/dna/bBaIM3/btsGBsBNUDl/AAAAAAAAAAAAAAAAAAAAAGUZdUlo0x_MIQi75zRxx8g-pz67fyJevwp_pnYLA1kp/boston.csv?credential=yqXZFxpELC7KVnFOS48ylbz2pIh7yKj8&expires=1767193199&allow_ip=&allow_referer=&signature=cAKZE%2BY38lHC2tBZHJSPtRgI5uY%3D 2024. 4. 13. 이전 1 2 3 4 5 6 다음 728x90 반응형