1. Chpater 7 - 손으로 쓴 숫자 훈련 GAN으로 MNIST Dataset을 Real Training Dataset으로 사용하여 Generator가 동일한 크기의 이미지를 만들도록 한다. 훈련이 진행될수록 Generator의 Image가 점차 Real Image와 같아지면서 Discriminator를 속일 수 있을 정도까지 발전하게 해야 한다. 이제 앞에서 사용했던 Library들을 import 해보자. import torch import torch.nn as nn import torch.optim as optim from torch.utils.data import Dataset import numpy as np import pandas as pd import random import matpl..
0. Abstract 최신 Object Detection Model들은 object location을 추정하기 위해 region proposal algorithm을 사용해왔다. SPPnet과 Fast R-CNN와 같은 모델들은 detection network에서 running time을 크게 줄였다고 볼 수 있다. 다만 여전히 region proposal 단계에서 병목(bottleneck) 현상이 생긴다는 단점이 있다. 이에 따라 본 논문에서는 Region Proposal 방법으로 RPN(Region Proposal Network)를 제안한다. RPN은 detection network와의 convolutional feature들을 공유하기 때문에 region proposal에 비용이 거의 들지 않는다. ..
1. Chapter 5 - GAN 개념 1.1) 이미지 생성하기 Backquery(역절의) 일반적인 Classifier를 생각해보자. Output Layer의 Activation Function으로 Softmax Activation을 사용하는 Multi-Class Classification Task를 수행한다. 예를 들어 MNIST 분류기는 784(28 * 28)개의 값을 Input으로 받아 10개의 Output으로 변환하기에, 처음보다 정보량이 감소한다. 만약 네트워크를 반대로 뒤집으면 이는 정보량을 감소시키는 행위가 아니라, 조금 더 사이즈가 큰 데이터(28 * 28)로 변환하는 것이다. 즉, 레이블을 주면 Neural Network를 통해 그에 해당하는 이미지를 생성해주는 것이다. 하나의 숫자(C..
Q1 Q. Data Augmentation 도중 transforms.ToTensor( ) 이전에 transforms.Normalize( )를 하면 오류가 왜 생겨? https://discuss.pytorch.org/t/not-clear-about-the-sequence-of-transforms-normalize-and-transforms-totensor/126254 Not clear about the sequence of transforms.Normalize and transforms.ToTensor Working with RGB image and binary mask as a target, I am confused about transformations. Is it necessary to rescale..
Q1 Q. Multi-Class Classification의 경우 위와 같이 코드를 작성하면 되지만, Binary Classification의 경우는 어떻게 다르게 작성해야 되는가? https://stackoverflow.com/questions/65916356/image-classification-using-pytorch Image classification Using Pytorch this is the code where I was working on Image Classification using Pytorch and I'm not able to get the accuracy right. the accuracy is exceeding 100 ,can anyone help me to find the ..
2. Deep Networks with Spatial Pyramid Pooling 2.1 Convolutional Layers and Feature Maps AlexNet과 같은 유명한 seven-layer architecture들을 생각해보면, 처음 5개의 Layer들은 Convolutional Layer이고, 마지막 2개의 Layer들은 Fully-Connected Layer이다. 5개 Convolutional Layer의 일부는 Pooling Layer가 붙어있는데, 이 Pooling Layer까지 모두 'Convolutional' Layer로 간주한다. 앞으로 Convolutional Layer이라 하면, 이는 Pooling Layer까지 포함하는 Layer이라 보면 된다. 2개의 FC Layer..
1. Introduction Object Detection에는 2가지 중요한 Challenges가 있는데, Object Location에 대한 수많은 Region Proposal들이 '처리' 되어야 한다 이러한 Proposal들은 'Rough Localization'이라, precise localization이 되기 위해 refine되어야 한다 이러한 Challenge들을 해결하기 위해 우리는 'Speed, Accuracy, Simplicity' 등에서 타협을 볼 수 밖에 없다. 이 논문에서는 Fast R-CNN(Fast Region-based Convolutional Neural Network)이라는 Method를 제안하는데, 이는 'single-stage training algorithm' 이다. 즉..
1. Preview Object Detection - Deep Learning 기반으로 발전했다. Object detection competition에서의 성능 지표를 보면 2013년을 기점으로해서 70% 후반까지의 비약적인 발전(AlexNet)을 했다. PASCAL VOC: image detection을 위한 dataset으로 classification, object detection, segmentation 평가 알고리즘을 구축하거나 평가하는데 매우 유명한 데이터 셋이다. Annotations : JPEGImages에 담겨있는 이미지 oject detection을 위한 정답 데이터. ImageSets : 특정 클래스가 어떤 이미지에 있는지 등에 대한 정보를 포함하는 폴더 JPEGImages : obj..
1. IoU 1-1) IoU (Intersection over Union) 모델이 예측한 결과(Predicted Bounding Box)와 실측(Ground Truth Bounding Box)이 얼마나 정확하게 겹치는가를 나타낸 지표 $IoU = \frac {Area\: of \: Intersection} {Area \: of \: Union}$ 즉, (개별 Box가 서로 겹치는 교집합 영역) / (전체 Box의 합집합 영역) 을 IoU라 한다. 1-2) IoU에 따른 Detection 성능 Poor: IoU 0.5 Excellent: 상대적으로 높을 때 (0.936) 다만, IoU 기준을 어떻게 잡느냐에 따라 다르다 2. mAP (mean Average Precision..