본문 바로가기
728x90
반응형

Python286

pandas.read_excel() 함수: 엑셀 파일(.xlsx)을 DataFrame으로 읽어들이는 함수임. 참고: pandas에서 Excel을 다루려면 openpyxl 라이브러리가 필요함: pip install openpyxl기본 사용법import pandas as pd# 엑셀 파일을 DataFrame으로 읽기df = pd.read_excel("파일경로.xlsx")print(df.head())key parameterssheet_name: 불러올 sheet(시트) 지정 (기본값은 첫 번째 시트)df = pd.read_excel("파일경로.xlsx", sheet_name="Sheet1")usecols: 특정 column(열)만 불러오기df = pd.read_excel("파일경로.xlsx", usecols="A:C") # A~C 열만df = pd.. 2025. 9. 26.
ReportLab-Python에서 PDF문서 만들기: ReportLab 은 Python에서 PDF 문서를 프로그래밍 방식으로 생성할 수 있는 BSD 라이선스 하에 배포되는 오픈소스 Python 라이브러리임.Canvas(저수준)와 Platypus(고수준) 두 가지 API를 제공해서간단한 보고서부터 복잡한 차트와 표가 포함된 전문적인 문서까지 모두 만들 수 있음.단, 처음부터 PDF문서를 만들 때 유용: 기존의 PDF를 합치거나 변경 또는 text추출은 PyMuPDF등이 보다 나은 선택임.단, PyMuPDF는 오픈소스 프로젝트에서만 무료이지 상업용은 라이선스가 필요함.BSD 라이선스는 상업적 패키지에서도 사용할 수 있는 매우 자유로운 라이선스임. 더보기2025.09.19 - [CE] - Open Source Licenses Open Source Licenses.. 2025. 9. 19.
Isolation Forest : random tree를 사용하는 ensemble-based anomaly detection algorithm.Outlier Detection에 사용되는 대표적인 Unsupervised Learning임.장점:랜덤 분할 기반이라 학습 속도가 빠르고, 고차원 데이터에서도 잘 동작.데이터 분포 가정 불필요.단점이상치 비율을 잘못 지정하면 성능 저하.밀집한 군집 내부의 국소적 이상치(local outlier)는 잘 못 잡을 수 있음.랜덤성에 민감할 수 있어 여러 번 실행 결과가 다를 수 있음.알고리즘 절차원 데이터에서 특징(feature)와 분할값(split value) 을 무작위로 선택해 노드를 분할.반복적으로 분할을 진행하면서 각 샘플을 하나의 leaf node에 고립시킴.위 과정을 여러 개의 랜덤 트리(f.. 2025. 9. 17.
[Ex] 사칙연산기 (CLI) 간단 구현하기-입력받기. 사칙연산기 (CLI) 간단 구현하기 다음을 참고:2024.07.24 - [Python] - [Python] 사용자와 상호작용: 입력받기: input, sys.argv and argparse [Python] 사용자와 상호작용: 입력받기: input, sys.argv and argparseinput() 함수 사용하기2023.10.10 - [Python] - [Python] input 함수 사용하여 사용자 입력받기. [Python] input 함수 사용하여 사용자 입력받기.Python의 input() 함수는표준 입력 스트림(stdin)으로부터 데이터를 입ds31x.tistory.com간단한 구현:❯ python hw.pyEnter operation (+,-,*,/) : +a = 3b = 4addition: 3.. 2025. 9. 15.
[Pandas] 차트 그리기-plot DataFrame Plot 주요 차트Line/Bar/Area : trend & 비교Hist/Box : 분포Scatter : 상관관계Pie : 비율DataFrame.plot.* 과 Series.plot.*는 같은 백엔드(matplotlib)를 사용.line, bar, barh, hist, box, area, pie는 Series에도 동일하게 사용 가능.단, scatter는 Series에는 없음 (왜냐하면 scatter는 최소 2개 축(x, y)이 필요하기 때문).아래에 나온 방식외에도 다음의 방식도 사용되기도함:# df.iloc[:20, :4].plot(title="Default df.plot() = Line Plot")df.plot(kind="line") # 선 그래프 (기본값)df.plot(k.. 2025. 9. 5.
[requests] Python의 requests 라이브러리 사용법. requests는 Python에서 HTTP 요청을 간단하고 직관적으로 보낼 수 있게 해주는 가장 널리 쓰이는 라이브러리임.복잡한 소켓 프로그래밍이나 urllib 모듈보다 훨씬 쉬운 인터페이스를 제공GET/POST/PUT/PATCH/DELETE 등 주요 HTTP 메서드를 한 줄 코드로 처리할 수 있음.또한 쿼리 파라미터, 헤더, 쿠키, 파일 업로드, 인증, 세션 관리 등 웹 API와 상호작용하는 데 필요한 기능을 모두 지원함. 다음의 URL을 한번 살펴보길 꼭 권함:Official Quick Start: https://requests.readthedocs.io/en/latest/user/quickstart/1. Pre-requisite: HTTPHTTP는 클라이언트(브라우저, 프로그램)와 서버가 통신하는 .. 2025. 8. 29.
728x90
반응형