'Research' 카테고리의 글 목록

[Paper Review] Controllable Generative Adversarial Network (ControlGAN)

2024.05.27

0. Abstract 최근 Generative Adversarial Network (GAN)은 realistic sample들을 생성하는 점에서 수많은 promising result를 보여준다. GAN Model의 핵심 task는 random distribution에서 Generator를 통해 생성된 sample들의 feature를 control하는 것이다. 즉, GAN은 generated sample의 feature를 control하는 것이 핵심이라 볼 수 있다. 위와 같이 생성된 sample의 feature를 control할 수 있는 GAN structure는 다음과 같다. 1) Conditional GAN (CGAN) 이는 desired major features를 가지고 성공적으로 s..

Research/Paper Review

[Paper Review] Mask R-CNN

2024.05.19

0. Before Reading Image Segmentation은 영상 혹은 이미지에서 의미있는 부분들을 구별해내는 기술이다. 이미지를 영역별로 나눠준 후, 각 개체에 맞게 합쳐주는 task 이다. Object Detection 혹은 Classification과 비교해봤을 때, 정확하게 개체들의 경계선까지 추출하여 의미있는 영역들로 분할해줘야 하므로 더 어려운 작업이라 볼 수 있다. Image Segmentation은 아래의 2가지로 분류된다.1) Semantic Segmentation2) Instance Segmentation (1) Semantic Segmentation Semantic Segementation은 동일한 객체들끼리는 한 번에 Masking을 수행하는 방법이다. 위의 사진..

Research/Paper Review

[Paper Review] CartoonGAN: Generative Adversarial Networks for Photo Cartoonization

2024.05.15

0. Abstract 논문의 저자들은 real-world 이미지들을 cartoon style의 이미지로 변환하는 방법을 제시한다. 이 방법은 "learning based methods"로 최근에 painting과 같은 artistic form으로 stylize image할 수 있어 인기가 많아졌다. 그러나 이러한 기존의 방법들은 cartoonization을 위해 만족할만한 결과를 내놓지는 못했다. 그 이유는 Cartoon Style Image에서 발생한 다음 2가지의 원인이 있다.1) Cartoon Style Image들은 unique한 특징들과 높은 수준의 simplification과 abstraction을 요구하기 때문이다.2) Cartoon Image들은 clear edges, smoot..

Research/Paper Review

[Paper Review] U-Net: Convolutional Networks for Biomedical Image Segmentation

2024.05.13

0. Abstract 기존에는 Deep Learning Network들을 성공적으로 훈련시키려면 수 천개의 annotated sample들이 필요했다. 그러나 U-Net의 경우 강력한 Data Augmentation 기법을 이용하여 few image 만으로도 효율적으로 모델을 훈련할 수 있도록 한다. U-Net Architecutre는 크게 2가지로 구성되어 있다. Contracting Path: capture contextExpansive Path: enable precise localization Skip Architecture를 사용해서 Shallow, Fine Layer의 Appearance Information (Local, Where)과 Deep, Coarse Layer의 ..

Research/Paper Review

[Paper Review] FCN (Fully Connected Networks for Semantic Segmentation)

2024.05.07

0. Before Reading Abstract에 들어가기 앞서, 논문의 핵심 사항들을 미리 정리하고 들어가겠다. FCN(Fully Convolutional Network)는 Classification task를 수행하는 FC Layer (Fully Connected Layer)를 제거하고, 오직 Convolutional Layer로만 Architecture를 구성하여 Semantic Segmentation을 수행한다. 이 논문에서는 모든 부분을 2가지로 나누어 설명한다.FCN (Fully Convolutional Networks)Semantic Segmentation Fully Convolutional Network의 경우, FCN을 수행하는 방법은 크게 3가지이다.Pixelwise Pr..

Research/Paper Review

[Paper Review] GAN (Generative Adversarial Networks)

2024.03.31

0. Abstract 해당 논문에서는 두 가지의 Model(Discriminator, Generator)을 Adversarial Process를 통해 동시에 훈련하는 Generative Model의 아이디어를 제안한다. Discriminator(판별자)는 Generator가 만든 Fake Data가 아닌 Real Data의 확률분포를 추정하고, Generator(생성자)는 임의의 Noise를 Sampling하여 Real Data와 유사한 분포를 Mapping(생성)한다. 이때, Generator는 Discriminator가 자신이 만든 Fake Data를 Real Data로 착각하도록 하는 확률을 최대화하도록 한다. 이러한 학습 구조를 minimax t..

Research/Paper Review

[Paper Review] YOLOv1

2024.03.25

2-stage detector는 localization과 classification을 수행하는 network 혹은 컴포넌트가 분리되어 있다. 이는 각 task가 순차적으로 진행되는 것을 의미하며, 이러한 과정에서 병목현상이 발생하여 detection 속도가 느려지게 된다. 반면 1-stage detector는 하나의 통합된 네트워크가 두 task를 동시에 진행한다. YOLO v1은 대표적인 1-stage detector로, FPS를 개선하여 real-time에 가까운 detection 속도를 보였다. Preview YOLO v1 YOLO v1은 localization과 classification을 하나의 문제로 정의하여 network가 동시에 두 task를 수행하도록 설계했다. 이를 위해 image를 지..

Research/Paper Review

[Paper Review] Faster R-CNN

2024.03.18

0. Abstract 최신 Object Detection Model들은 object location을 추정하기 위해 region proposal algorithm을 사용해왔다. SPPnet과 Fast R-CNN와 같은 모델들은 detection network에서 running time을 크게 줄였다고 볼 수 있다. 다만 여전히 region proposal 단계에서 병목(bottleneck) 현상이 생긴다는 단점이 있다. 이에 따라 본 논문에서는 Region Proposal 방법으로 RPN(Region Proposal Network)를 제안한다. RPN은 detection network와의 convolutional feature들을 공유하기 때문에 region proposal에 비용이 거의 들지 않는다. ..

Research/Paper Review

[Paper Review] SPPnet (Spatial Pyramid Pooling Network)

2024.03.12

2. Deep Networks with Spatial Pyramid Pooling 2.1 Convolutional Layers and Feature Maps AlexNet과 같은 유명한 seven-layer architecture들을 생각해보면, 처음 5개의 Layer들은 Convolutional Layer이고, 마지막 2개의 Layer들은 Fully-Connected Layer이다. 5개 Convolutional Layer의 일부는 Pooling Layer가 붙어있는데, 이 Pooling Layer까지 모두 'Convolutional' Layer로 간주한다. 앞으로 Convolutional Layer이라 하면, 이는 Pooling Layer까지 포함하는 Layer이라 보면 된다. 2개의 FC Layer..

티스토리툴바