1. Introduction Object Detection에는 2가지 중요한 Challenges가 있는데, Object Location에 대한 수많은 Region Proposal들이 '처리' 되어야 한다 이러한 Proposal들은 'Rough Localization'이라, precise localization이 되기 위해 refine되어야 한다 이러한 Challenge들을 해결하기 위해 우리는 'Speed, Accuracy, Simplicity' 등에서 타협을 볼 수 밖에 없다. 이 논문에서는 Fast R-CNN(Fast Region-based Convolutional Neural Network)이라는 Method를 제안하는데, 이는 'single-stage training algorithm' 이다. 즉..
Block 구조 BasicBlock: ResNet 18, 34 Bottleneck: ResNet 50, 101, 152 Q. ResNet의 Architecture를 보면 Pooling을 맨 처음과 맨 끝을 제외하고 사용하지 않는다. 그렇다면 Feature Map의 size를 어떻게 줄이는가? A. 실선을 Projection Shorcut, 점선을 Identity Shortcut 이라 한다. Projection은 $1 \times 1$ Convolution이며, Down-Sampling (with stride=2) 및 Channel ($1 \times 1$ Convolution) 수를 맞춰준다. 만약 Size가 같을 때는 stride=1로 맞춰준다. BasicBlock 정의 import torch impo..
https://ieeexplore.ieee.org/document/8578843 Squeeze-and-Excitation Networks Convolutional neural networks are built upon the convolution operation, which extracts informative features by fusing spatial and channel-wise information together within local receptive fields. In order to boost the representational power of a network, se ieeexplore.ieee.org 1. Abstract 최근 Building Block을 중심으로 CNN이 발전하..
1. Module Import & GPU Usage Basic Module import import torch import torch.nn as nn import torch.nn.functional as F import torch.optim as optim from torchvision import datasets, transforms from torchvision.transforms import autoaugment from torch.utils.data import DataLoader, random_split import numpy as np import os from PIL import Image import matplotlib.pyplot as plt M1 Macbook에서 GPU 사용: mps ..