728x90 반응형 Python286 [Python] venv : Python Virtual Environment Python 3의 경우, standard library로 venv를 virtual environment를 위해 제공하고 있음: 3.3에 기본 내장.이를 통해 프로젝트마다 적절한 package들을 사용할 수 있게 됨. 2025.03.02 - [개발환경] - [Tool] conda 사용법 - Anaconda and Miniconda [Tool] conda 사용법 - Anaconda and Miniconda1. Conda란?프로그래밍 언어(특히 Python)의 패키지, 종속성을 관리하기 위한 오픈 소스 패키지 관리 시스템(or Package Manager)과이들이 설치되어 구성되는 (가상)환경을 관리하는 환경 관리 시스템임.cods31x.tistory.com Create a virtual environment.. 2023. 6. 30. [Python] pip 사용법 이 문서는 pip (Pip Install Python or Installer for Python)의 사용법을 간략히 정리해둔 것임.pip란?https://dsaint31.tistory.com/534 [Python] pip 란 (Package Management System)정의pip는 Pip Installs Python를 줄인 말로, Python에서 기본적으로 사용되는 Python package management system임.pip와 같이, 줄임말이 원래 문장에 다시 들어가 있는 경우를 recursive acronym (or recursice initialism)이dsaint31.tistory.comInstallationpip는 python을 설치할 때 같이 설치되는 경우가 대다수라 따로 설치할 경우.. 2023. 6. 30. [PDF] Merge PDF PyMuPDF 1.22.5 (from pip) PyMuPDF를 이용하여, 여러 PDF를 그냥 합쳐주는 간단한 프로그램을 만들어 봤다.(문서 합쳐서 제출하는 일이 잦았나보다. 예제 생각하다가 이게 떠오르다니... --;;) 참고로, fitz가 PyMuPDF 패키지의 import alias임 — PDF 페이지를 열고, 병합하고, 저장하는 등의 작업을 수행 대부분의 PDF를 다루는 패키들과 마찬가지로, 새로운 pdf 파일에 대한 객체를 empty로 먼저 만든 후, 각 pdf들을 읽어들여 이들을 page로 추가해주면 되는 방식이다. 추가적으로 argparse에 대한 예제로 쓸만할 거 같다. 예제코드코드는 다음과 같다.import argparseimport osimport fitz # PyMuPDF 모듈: PD.. 2023. 6. 28. [PDF] Text 추출하기: PyPDF2 vs. PyMuPDF version : PyPDF 2.11.1 (from Mamba), PyMuPDF 1.22.5 (from pip) 여러 pdf처리 library가 있지만, 그나마 제일 많이 써본 터라 PyPDF2를 선호한다. 추출 정확도는 PyMuPDF보다 좀 떨어지는 거 같지만, 익숙함이 주는 편의성을 무시 못한다. 현재 최신 version은 3.11.1 이지만, 내가 사용하는 mamba에서는 2.11.1로 설치가 이루어짐. 우선 다음과 같은 2개의 페이지를 가진 pdf에서 텍스트를 추출해봤다. 위 그림은 90도로 font들이 돌아가있는 첫번째 페이지이고, 위 그림은 일반적인 orientation으로 기재된 두번째 페이지를 보여줌. 이를 다음과 같이 각 페이지 별로 orientation에 맞게 추출을 해봤다. 사용된 c.. 2023. 6. 28. 이전 1 ··· 45 46 47 48 다음 728x90 반응형