영상처리/딥러닝

GAN

sumiin 2022. 7. 6. 16:00
반응형
SMALL
  • Unsupervised 학습 방식
  • Generative 모델로서 노이즈로부터 실제와 유사한 결과물 생성

 

Generative Model vs Discriminative Model

 

 

CycleGAN

  • 쌍을 이루지 않은 데이터 셋으로 학습이 가능한 image-to-image translation 메서드를 제안 

 

GAN의 목표와 Image-to-Image Translation 소개

  •  Gan을 이용하여 이미지의 분포를 근사하는 모델 G를 학습
  • 생성 모델(Generative Model) : 실존하지 않지만 있을 법한 이미지를 생성할 수 있는 모델을 의미

 

Generative Adversarial Network (GAN) 구조 살펴보기

  • 생성자(generator)와 판별자(discriminator) 두 개의 네트워크로 구성 
    • 판별자는 특정한 이미지의 진짜/ 가짜 여부를 판별
    • 생성자는 판별자를 속일 수 있는 이미지를 생성 
  • 목적함수를 통해 생성자가 이미지 분포를 학습할 수 있음 
  • Generator G(z) : 새로운 이미지 생성
  • D(x) : 진짜 이미지인 경우, 1 가짜인 경우 0을 내보내도록 함 

D 입장에서는 1이라는 값을 내보낼 수 있도록 진짜 이미지를 진짜라고 판별하도록 함 

가짜 이미지가 들어오는 경우, 생성자가 만든 이미지는 가짜라고 분류할 수 있도록 D를 학습

동일한 식에 대하여 D는 maximization하고 G는 minimization하며 번갈아가며 학습을 수행

 

Conditional GAN (cGAN)

  • 데이터의 모드를 제어할 수 있도록 조건 정보를 함께 입력하는 모델 
  • 레이블 정보(y)를 함께 입력으로 넣어줌 

Pix2Pix : 대표적인 Image-to-Image Translation 네트워크

  • 픽셀들을 입력으로 받아 픽셀들을 예측한다는 의미
  • 서로 다른 두 도메인 X,Y 의 데이터 두 개를 한 쌍으로 묶어 학습을 진행 
  • 한쌍으로 묶이지 않은 데이터 셋에 대해서도 적용이 가능할까요?
    • CycleGAN을 이용하여 해결 가능
    •  

 

반응형
LIST