본문 바로가기

분류 전체보기333

[CLI] Power shell에서 한글 경로 한글은 정말 훌륭한 언어이지만... 개발 환경에서 가급적 피해야할 것이 한글이 들어간 path임. 특히 open source library들을 많이 이용해야하는 경우 골아픈 일이 생길 확률이 커진다. utf-8이 일반화되면서 정말정말 많이 개선이 되었지만, 그래도 공백문자와 한글이 들어간 경로를 사용하는 건 절대 하지 말라고 권한다. (아무리 애기해도 꼭 그렇게 하는 사람들이 있다. ㅋ) 간단한 예로 power shell에서 cat 명령어와 echo명령어를 수행한 경우를 들어본다. cat은 한글이 들어간 경로의 power shell 의 프로파일을 못 찾는다는 메시지를 보인다. ==;; echo는 제대로 동작한다. 한글 경로를 사용했고 script에서 사용한 명령어나 소스 코드의 라이브러리가 해당 경로의 .. 2023. 6. 29.
[CLI] Power Shell의 Profile 수정 : conda를 위해서 Power Shell의 profile 경로에 한글이 있는 경우, conda등의 activate가 제대로 안되는 경우가 있다. 이 경우가 발생하는 대부분의 이유는 사용자 이름 등을 한글로 한 경우나... onederive를 한글 윈도우에서 설정하는 등으로 인해, 한글이 경로에 들어가는 경우가 많다. 위의 이유로 conda activate가 안되는 경우, Power Shell의 profile에 처리를 다시 해주면 된다. 시작하기 앞서, conda 명령어로 powershell에 대한 초기화를 다음의 명령어로 수행하여 conda activate를 위한 profile파일의 내용이 있는 script를 얻고 위치가 어딘지를 확인한다. conda init powershell 이 경우 변경이 이루어진 다양한 script.. 2023. 6. 29.
[Env] oh-my-posh에서 conda env prefix 없애기 Powershell에서 다음과 같은 형태로 conda의 환경을 나타내는 문자열이 앞에 보임. *개인적으로 그냥 귀찮아서 놔두었는데... 계속 질문을 받은 터라. 지우는 방법을 정리함.) 위 그림에서 보이듯이 (base)가 prompt 앞에 보인다. 사실 oh-my-posh 에서 python의 가상환경이 보이는 기능이 있어서 이는 중복된 정보이니 지우는게 낫다. 이 문제를 해결하려면, Power Shell의 profile을 수정하면 된다. notepad $PROFILE 참고로 $PROFILE은 powershell의 profile로 onedrive를 사용할 경우 다음과 같은 경로를 가르킴. C:\Users\dsain\OneDrive\문서\PowerShell\Microsoft.PowerShell_profile.. 2023. 6. 29.
[CLI] 명령어 위치 찾기. Linux which 명령어 예를 들어 which ls 를 수행하면 ls명령어가 있는 경로가 출력됨. Commnad Prompt (cmd) 윈도우즈의 cmd에서는 다음과 같음. where 명령어 which와 완전히 같다. - -;; Power Shell 이 녀석은 자주 잊는다. ==;; get-command 명령어 앞의 둘과 달리 version 이나 type (alias여부) 등을 보여준다. 2023. 6. 28.
[PDF] Merge PDF PyMuPDF 1.22.5 (from pip) PyMuPDF를 이용하여, 여러 PDF를 그냥 합쳐주는 간단한 프로그램을 만들어 봤다. (문서 합쳐서 제출하는 일이 잦았나보다. 예제 생각하다가 이게 떠오르다니... --;;) 대부분의 PDF를 다루는 패키들과 마찬가지로, 새로운 pdf 파일에 대한 객체를 empty로 먼저 만든 후, 각 pdf들을 읽어드령 이들을 page로 추가해주면 되는 방식이다. 추가적으로 argparse에 대한 예제로 쓸만할 거 같다. 예제코드 코드는 다음과 같다. import argparse import os import fitz def set_argparse (): parser = argparse.ArgumentParser( description = "This program can.. 2023. 6. 28.
[PDF] Text 추출하기: PyPDF2 vs. PyMuPDF version : PyPDF 2.11.1 (from Mamba), PyMuPDF 1.22.5 (from pip) 여러 pdf처리 library가 있지만, 그나마 제일 많이 써본 터라 PyPDF2를 선호한다. 추출 정확도는 PyMuPDF보다 좀 떨어지는 거 같지만, 익숙함이 주는 편의성을 무시 못한다. 현재 최신 version은 3.11.1 이지만, 내가 사용하는 mamba에서는 2.11.1로 설치가 이루어짐. 우선 다음과 같은 2개의 페이지를 가진 pdf에서 텍스트를 추출해봤다. 위 그림은 90도로 font들이 돌아가있는 첫번째 페이지이고, 위 그림은 일반적인 orientation으로 기재된 두번째 페이지를 보여줌. 이를 다음과 같이 각 페이지 별로 orientation에 맞게 추출을 해봤다. 사용된 c.. 2023. 6. 28.
반응형