본문 바로가기
728x90
반응형

DATA7

MS COCO (Microsoft의 Common Object in Context) Dataset COCO 데이터셋은 여러 종류의 task 에 대한 모델을 훈련시킬 수 있음: 다음의 task들로 구분됨.1. Object Detection (객체 탐지)목적: 이미지 안에 있는 객체의 location 과 class (=category)를 추출 : things만annotationbbox (bounding box)category_id (int)출력 예사람, 자동차, 개 등 80개 클래스대표 사용 모델Faster R-CNN, YOLO, RetinaNet 등관련 디렉토리 및 파일들.train2017/val2017/annotations/instances_*.json2. Instance Segmentation (인스턴스 분할)목적: 객체를 pixel 단위로 정확히 분리 : things만annotationsegme.. 2025. 12. 16.
[C] LLP64 vs. LP64 LLP64와 LP64는 C/C++ 컴파일러가 데이터 타입의 크기를 정의하는 데이터 모델(data model) 임. LLP64와 LP64는 는 해당 모델이 어떤 타입들을 64비트로 처리하는지를 나타내는 이름을 가짐.long과 pointer가 다른 크기면, 포인터를 long에 저장할 때 잘림(truncation) 문제가 발생할 수 있음플랫폼 간 이식성(portability) 확보를 위해서는 정확한 타입 사용이 필수LLP64, LP64 명칭의 의미이름약어 의미설명환경LP64Long and Pointer = 64-bitlong과 pointer가 64비트 (8바이트)로 확장됨gcc, clangLLP64Long Long and Pointer = 64-bitlong long과 pointer는 64비트, long은 여.. 2025. 3. 21.
[DL] Dataset: CIFAR-10 CIFAR-10Canadian Institute for Advanced Research (캐나다 고등 연구원, CIFAR)에서 CIFAR라는 이름이 붙여짐(당시 연구자금을 지원한 단체의 이름에서 유래.) CIFAR-10은 Machine Learning 과 Computer Vision 의 학습에서 널리 사용되는 image dataset.캐나다 토론토 대학교의 Alex Krizhevsky, Vinod Nair, Geoffrey Hinton에 의해 만들어짐 (2009년).Alex Krizhevsky (알렉스 크리세브스키)는 ImageNet에서 딥러닝의 가치를 전세계에 알린 AlexNet(2012년)의 주요 개발자임.AlexNet은 Alex Krizhevsky의 이름을 따서 명명됨.https://dsaint31.. 2024. 5. 30.
[ML] Dataset: Wisconsin Breast Cancer Dataset Wisconsin Breast Cancer Dataset (WBCD):Wisconsin Breast Cancer Dataset (WBCD)은오늘날 Machine Learning 및 Data Science 분야에서binary classification 교육용으로 자주 사용되는 Dataset임. Wisconsin 대학의 병리학자인 Dr. William H. Wolberg가 수집한 dataset이며 다음의 사이트를 통해 다운로드 가능함.https://archive.ics.uci.edu/dataset/17/breast+cancer+wisconsin+diagnosticftp서버는 다음과 같음: ftp.cs.wisc.edu cd math-prog/cpo-dataset/machine-learn/WDBC/ 하지만, s.. 2024. 5. 18.
[DL] Dataset: Boston Housing Price Boston Housing Data 1970년 대 보스턴 시의 주택가격 데이터으로California Housing Data 와 함께 기계학습의 연습용 데이터로 많이 애용됨. 현재 California Housing Data로 대체되는 추세임California Housing Data가 1990대 후반에 얻어진 보다 최신 데이터이면서 인종적 편견을 유발하는 feature가 없고 보다 많은 sample 수 로 구성되었다는 장점을 가짐. 집값은 Median Price이며,해당 집값에 영향을 주는 다양한 13개의 요소들로 구성됨.전체 샘플의 수는 506개임.더보기참고로,TensorFlow 의 Keras 의 dataset 모듈에서 제공하는 boston_housing 의 load_data로 train dataset과 .. 2024. 4. 18.
[DL] PyTorch: view, data, and detach PyTorch에서 tensor.view()와 tensor.data를 제공하며 이들은 다음과 같은 용도로 사용됨.tensor.view()tensor.view(*shape) 메서드는 tensor 인스턴스의 dimension을 수정하는데 사용됨.이 메서드는 새로운 shape를 가진 같은 데이터의 새로운 tensor 인스턴스를 반환하지만, 원본 tensor 인스턴스와 underlying memory를 공유하여 같은 데이터를 공유함.즉, 메모리를 재할당하지 않고 tensor의 shape와 각 축의 stride만이 바뀜.view()를 사용할 때 반환되는 tensor 인스턴스는 기본 텐서 인스턴스와 데이터를 공유하기 때문에,하나를 변경하면 다른 하나도 변경됨.이는 Nueral Network를 구축할 때, 각 laye.. 2024. 3. 22.
728x90
반응형