728x90 반응형 EDA4 [Pandas] missing value 확인: 결측치 확인 Pandas 는 missing value (정확하게는 NA) 여부를 확인하는 다음의 메서드를 지원:isnull()isna()Note:isnull() 과 isna()는 기능적으로 동일함: NumPy의 ndarray가 지원하는 isnan() 기반.Pandas 0.20.0 버전부터 isnull()의 별칭(alias)으로 isna()가 추가됨.결측치 타입Pandas는 NumPy의 ndarray에 기반을 두고 있기 때문에 float64의 실수 데이터의 경우 missing value를 np.nan으로 처리함.단, Pandas 1.0+ 에서 사용가능한 pd.NA ( __repr__()메서드로 라고 출력됨) 가 Pandas에서 일관된 결측치 처리에 보다 유용함.pd.NA는 Pandas의 확장 dtype인 (Int64,.. 2025. 8. 24. [ML] pandas.DataFrame 에서 EDA에 적합한 메서드 요약 Pandas DataFrame에서 탐색적 데이터 분석(EDA)에 사용할 수 있는 주요 메서드들은 다음과 같음:2024.05.18 - [분류 전체보기] - [ML] Exploratory Data Analysis (EDA) [ML] Exploratory Data Analysis (EDA)Exploratory Data Analysis (탐색적 데이터 분석, EDA)EDA(탐색적 데이터 분석)은 실험 또는 데이터 프로젝트에서 데이터를 분석하는 첫 번째 단계임.EDA를 통해 분석가들은 데이터를 이해하고, 가설을 세ds31x.tistory.com1. 기본 정보 확인df.head(), df.tail() - 데이터의 처음/끝 부분 보기df.shape - 행과 열의 수 확인df.info() - 데이터 타입과 결측치 정보.. 2025. 5. 16. [ML] Exploratory Data Analysis (EDA) Exploratory Data Analysis (탐색적 데이터 분석, EDA)EDA(탐색적 데이터 분석)은 실험 또는 데이터 프로젝트에서 데이터를 분석하는 첫 번째 단계임.EDA를 통해 분석가들은 데이터를 이해하고, 가설을 세움EDA를 통해 더 정형화된 분석 방법으로 넘어가기 전에 주어진 가정을 확인.탐색적 데이터 분석(EDA)의 주요 구성 요소Descriptive Statistics (기술 통계) :Measures of Central Tendency (중심 경향의 척도: mean, median, mode).Measures of Dispersion (분산 척도: variance, std, range, interquatile range=IQR).Skewness (왜도)와 Kurtosis (첨도).Data .. 2024. 5. 18. [pandas] merge 예제. merge와 concat의 차이점:2024.01.12 - [Python] - [pandas] DataFrame 합치기 : concat 과 merge [pandas] DataFrame 합치기 : concat 과 mergePandas에서 merge와 concat은 DataFrame 를 합치는(결합하는) 데 사용되는 방법.merge:SQL join과 유사함.두 DataFrame 간의 공통 column이나 index를 기준 column ( on parameter)으로 삼아 결합inner, outer, left, right 다양한ds31x.tistory.com merge는 특정 column을 기준으로 하는 데이터프레임 결합이 필요한 경우 이용됨. merge 는 기본적으로 inner join임.concat 이 기본.. 2024. 1. 12. 이전 1 다음 728x90 반응형