Labels
라벨(Label)은 예측하고자 하는 대상 항목을 의미 (단순 선형 회귀에서 y변수)
Image Classification
이미지 분류를 할 때 시스템은 입력 이미지를 수신
시스템은 미리 결정된 범주 또는 레이블 집합을 인식
컴퓨터의 역할은 그림을 보고 고정된 범주 레이블 중 하나를 지정하는 것
컴퓨터는 이미지를 거대한 숫자 그리드로 표현
시맨틱 갭(semantic gap)
고양이에 대한 레이블은 우리가 이 이미지에 할당하는 의미론적 레이블
고양이의 의미론적 아이디어와 컴퓨터가 실제로 보고 있는 이 픽셀 값 사이에는 엄청난 차이 존재
데이터 기반 접근 방식
1. Collect a dataset of images and labels
2. Use Machine Learning to train a classifier
3. Evaluate the classifier on new images
First classifier : Nearest Neighbor
훈련 단계 : Memorize all data and labels
예측 단계 : Predict the lavel of the most simillar\
(새 이미지를 가져와서 훈련 데이터에서 새 이미지와 가장 유사한 이미지를 찾고 가장 유사한
이미지의 레이블을 예측하려고 함 )
Example Dataset : CIFAR-10
(머신 러닝에서 매우 일반적으로 사용되는 데이터 세트)
10가지 다른 클래스 제공
이 10개 범주에 대해 각각 50,000개의 이미지가 균등하게 분포(training images)
알고리즘을 테스트해야하는 10,000개의 추가적인 이미지 존재 (testing images)
한 쌍의 이미지가 주어지면 실제로 비교하는 방법
L1 distance (맨해튼 거리)
이미지의 개별 픽셀을 피교
|(test image 픽셀 값) - (training image 픽셀 값) | 을 모든 픽셀에 대해 계산하고 합친 값
K-Nearest Neighbors
가장 가까운 이웃을 찾는 대신 K개의 이웃 중에서 더 많이 포함되는 곳으로 선택 함
L2(Euclidean) distance
훈련 세트 : 레이블이 있는 이미지 세트
검증 세트 : 알고리즘이 얼마나 잘 작동하는지 확인하기 위한 세트
Linear Classification
Parametric Approach
왼쪽에 있는 고양이의 이미지와
x로 쓰는 이 이미지와
w라고 하는 매개변수 또는 가중치 세트
데이터 x와 매개변수 w를 모두 받는 함수 작성
그러면 cifar의 10개 범주 각각에 해당하는 점수가 나옴
-> 테스트 시간에 훈련 데이터가 필요 없고 이러한 매개변수 w만 필요
'영상처리 > 딥러닝' 카테고리의 다른 글
[CycleGAN논문 리뷰] Unpaired Image-to-Image Translationusing Cycle-Consistent Adversarial Networks (0) | 2022.07.12 |
---|---|
SRGAN (0) | 2022.07.08 |
CycleGAN (0) | 2022.07.08 |
GAN (0) | 2022.07.06 |
CS231n Lecture 1 | Introduction to Convolutional Neural Networks for Visual Recognition (0) | 2022.06.01 |