728x90 반응형 ETL3 [ML] pandas.DataFrame 에서 EDA에 적합한 메서드 요약 Pandas DataFrame에서 탐색적 데이터 분석(EDA)에 사용할 수 있는 주요 메서드들은 다음과 같음:2024.05.18 - [분류 전체보기] - [ML] Exploratory Data Analysis (EDA) [ML] Exploratory Data Analysis (EDA)Exploratory Data Analysis (탐색적 데이터 분석, EDA)EDA(탐색적 데이터 분석)은 실험 또는 데이터 프로젝트에서 데이터를 분석하는 첫 번째 단계임.EDA를 통해 분석가들은 데이터를 이해하고, 가설을 세ds31x.tistory.com1. 기본 정보 확인df.head(), df.tail() - 데이터의 처음/끝 부분 보기df.shape - 행과 열의 수 확인df.info() - 데이터 타입과 결측치 정보.. 2025. 5. 16. [pandas] merge 예제. merge와 concat의 차이점:2024.01.12 - [Python] - [pandas] DataFrame 합치기 : concat 과 merge [pandas] DataFrame 합치기 : concat 과 mergePandas에서 merge와 concat은 DataFrame 를 합치는(결합하는) 데 사용되는 방법.merge:SQL join과 유사함.두 DataFrame 간의 공통 column이나 index를 기준 column ( on parameter)으로 삼아 결합inner, outer, left, right 다양한ds31x.tistory.com merge는 특정 column을 기준으로 하는 데이터프레임 결합이 필요한 경우 이용됨. merge 는 기본적으로 inner join임.concat 이 기본.. 2024. 1. 12. [Term] ETL Tools ETL Tool에 대한 정의: "ETL Tools" 에서 ETL은Extract,Transform,Load의 약자로, 데이터를 다루는 세 가지 주요 과정을 의미함. 이들은 대규모 데이터를 다루는데 사용되는 Tool로써 다음과 같은 세가지 과정을 효과적으로 수행할 수 있게 해주는 도구를 가르킴.Extract (추출):데이터를 원본 소스(예: 데이터베이스, CRM 시스템, 파일 등)에서 가져오는 과정.이 과정에서 다양한 형식과 구조를 가진 데이터를 수집.Transform (변환):추출된 데이터를 필요에 맞게 변환하는 과정.데이터를 정제, 표준화, 결합, 분리 등의 작업을 통해 분석 가능한 형태로 만.이는 데이터의 품질을 향상시키고, 분석에 적합하게 데이터를 조정하는 과정을 포함.Load (로드):변환된 데이터.. 2024. 1. 10. 이전 1 다음 728x90 반응형