반응형
SMALL

영상처리/딥러닝 8

[RFA 논문 리뷰]Residual Feature Aggregation Network for Image Super-Resolution

Absrtact existing methods neglect to fully utilize the hierarchical features on the residual branches. To address this issue, we propose a novel residual feature aggregation (RFA) framework for more efficient feature extraction. The RFA framework groups several residual modules together and directly forwards the features on each local residual branch by adding skip connections To maximize the po..

[SRGAN 논문 리뷰]Photo-Realistic Single Image Super-Resolution Using a Generative AdversarialNetwork

1. Introduction The highly challenging task of estimating a highresolution (HR) image from its low-resolution (LR) counterpart is referred to as super-resolution (SR). The optimization target of supervised SR algorithms is commonly the minimization of the mean squared error (MSE) between the recovered HR image and the ground truth. 1.1. Related work 1.1.1 Image super-resolution focus on single i..

[CycleGAN논문 리뷰] Unpaired Image-to-Image Translationusing Cycle-Consistent Adversarial Networks

Abstract We present an approach for learning to translate an image from a source domain X to a target domain Y in the absence of paired examples. 1. Introduction Paired training data (left) consists of training examples {xi , yi} N i=1, where the correspondence between xi and yi exists . unpaired training data (right), consisting of a source set {xi} N i=1 (xi ∈ X) and a target set {yj}M j=1 (yj..

SRGAN

Super-Resolution Image Super-Resolution은 저해상도 이미지를 고해상도로 변환시키는 문제를 의미 미디어, 의료, 보안 등 다양한 산업 분야에서 중요한 문제로 대두되고 있음 Image Super-Resolution 분류 저해상도 이미지로 고해상도 이미지를 예측하는 Supervised Learning 방식 Generative Adversarial Network 을 활용해 고해상도 이미지를 생성하는 방식 In training, I(LR) is obtained by appli=ying a Gaussian fillter ro I(HR) followed by a downsampling operation with downsampling factor r. Perceptual loss fun..

CycleGAN

CycleGAN CycleGAN의 문제 상황 : Unpaired 데이터셋 상황에서 GAN 손실 함수만 사용한다면? 특정한 이미지 x가 주어졌을 떄, target domain Y 의 그럴싸한 이미지로 바꾸도록 학습할 수 있음 (x랑 y는 서로 매칭되어 있지 않은 상태 ) 매칭되는 y없이 단순히 이미지 x의 특성을 타겟 도메인 Y의 특성으로 바꾸고자 함 어떤 입력이든 y 도메인에 해당하는 하나의 이미지만 내보내려고 학습이 될 수도 있음 결과적으로 , 추가적인 제약조건이 필요 CycleGAN의 핵심 아이디어 Cycle-consistency loss를 사용 이미지를 translation 시킬 때, 다시 원본으로 돌아올 수도 있도록 함 CycleGAN은 G(x)가 다시 원본 이미지 x로 재구성될 수 있도록 함 원..

GAN

Unsupervised 학습 방식 Generative 모델로서 노이즈로부터 실제와 유사한 결과물 생성 Generative Model vs Discriminative Model CycleGAN 쌍을 이루지 않은 데이터 셋으로 학습이 가능한 image-to-image translation 메서드를 제안 GAN의 목표와 Image-to-Image Translation 소개 Gan을 이용하여 이미지의 분포를 근사하는 모델 G를 학습 생성 모델(Generative Model) : 실존하지 않지만 있을 법한 이미지를 생성할 수 있는 모델을 의미 Generative Adversarial Network (GAN) 구조 살펴보기 생성자(generator)와 판별자(discriminator) 두 개의 네트워크로 구성 판별..

CS231n Lecture 2 | Image Classification

Labels 라벨(Label)은 예측하고자 하는 대상 항목을 의미 (단순 선형 회귀에서 y변수) Image Classification 이미지 분류를 할 때 시스템은 입력 이미지를 수신 시스템은 미리 결정된 범주 또는 레이블 집합을 인식 컴퓨터의 역할은 그림을 보고 고정된 범주 레이블 중 하나를 지정하는 것 컴퓨터는 이미지를 거대한 숫자 그리드로 표현 시맨틱 갭(semantic gap) 고양이에 대한 레이블은 우리가 이 이미지에 할당하는 의미론적 레이블 고양이의 의미론적 아이디어와 컴퓨터가 실제로 보고 있는 이 픽셀 값 사이에는 엄청난 차이 존재 데이터 기반 접근 방식 1. Collect a dataset of images and labels 2. Use Machine Learning to train a ..

CS231n Lecture 1 | Introduction to Convolutional Neural Networks for Visual Recognition

컴퓨터 비전의 역사 - 시각은 인간의 지능 중 가장 큰 감각 시스템 - 카메라 옵스큐라 -핀홀 카메라 이론에 기초한 카메라 - 시각 처리 관점에서 인간의 두뇌와 다소 유사한 고양이 두뇌를 관찰 시각적 처리가 방향이 지정된 가장자리에서 시작하고 정보가 시각적 처리 경로를 따라 이동함에 따라 뇌가 시각적 정보의 복잡성을 축적 Block world Larry Roberts, 1963 시각적 세계를 기하학적 모양으로 단순화하고 이를 인식할 수 있도록 하는 것이 목표인 컴퓨터 비전의 최조 논문 중 하나 David Marr (1960년대) 자신이 생각하는 비전이 무엇이며 컴퓨터 비전에 대해 어떻게 생각하고 컴퓨터가 시각적 세계를 인식할 수 있도록 하는 알고리즘을 개발해야 하는지에 대한 영향력 있는 책 저술 시각 정..

반응형
LIST