[Pandas] Reduction 과 Aggregation
0. Reduction 과 Aggregation — Pandas에서의 개념 차이Reduction (축소형 집계)여러 값을 하나의 값으로 줄이는 연산.예: sum, mean, min, max, std, median, skew, kurt, sem, quantile특징:단일 함수로 단일 결과 산출Aggregation의 부분집합.Aggregation (종합 집계)데이터를 모아 요약하는 더 큰 개념.여러 Reduction 함수를 동시에 적용하거나, 그룹별 요약 포함.예: agg, groupby(...).agg(...), describe.특징:다양한 Reduction을 조합, 그룹 단위 집계 가능reduction을 포함하는 상위 개념.Note : Aggregation ⊃ Reduction즉, 모든 Reduction..
2025. 8. 21.
[Pandas] 중복 데이터 삭제-drop_duplicates() 메서드
drop_duplicates는 DataFrame에서 중복된 행(row) 을 제거할 때 사용하는 메서드.기본적으로 전체 row 전체를 기준 으로 중복을 판별.subset 파라미터를 사용하면 특정 column 하나 혹은 여러 columns을 기준으로 중복을 판별하여 제거할 수 있음.예제예제를 위한 간단한 DataFrame생성import pandas as pd# 간단한 DataFrame 생성df = pd.DataFrame({ "Name": ["Alice", "Bob", "Charlie", "Alice", "Bob"], "Sex": ["F", "M", "M", "F", "M"], "Age": [25, 30, 30, 25, 40]})print("원본 DataFrame:")print(df)기본 사용..
2025. 8. 21.