영상처리/딥러닝

CS231n Lecture 2 | Image Classification

sumiin 2022. 6. 6. 18:39
반응형
SMALL

Labels

라벨(Label)은 예측하고자 하는 대상 항목을 의미 (단순 선형 회귀에서 y변수)

 

Image Classification

이미지 분류를 할 때 시스템은 입력 이미지를 수신

시스템은 미리 결정된 범주 또는 레이블 집합을 인식

컴퓨터의 역할은 그림을 보고 고정된 범주 레이블 중 하나를 지정하는 것

컴퓨터는 이미지를 거대한 숫자 그리드로 표현

숫자 레이블로 표현한 이미지

시맨틱 갭(semantic gap)

고양이에 대한 레이블은 우리가 이 이미지에 할당하는 의미론적 레이블 

고양이의 의미론적 아이디어와 컴퓨터가 실제로 보고 있는 이 픽셀 값 사이에는 엄청난 차이 존재 

 

 데이터 기반 접근 방식 

1. Collect a dataset of images and labels

2. Use Machine Learning to train a classifier

3. Evaluate the classifier on new images

 

First classifier : Nearest Neighbor

훈련 단계 : Memorize all data and labels 

예측 단계 : Predict the lavel of the most simillar\

(새 이미지를 가져와서 훈련 데이터에서 새 이미지와 가장 유사한 이미지를 찾고 가장 유사한

 이미지의 레이블을 예측하려고 함 )

 

Example Dataset : CIFAR-10

(머신 러닝에서 매우 일반적으로 사용되는 데이터 세트)

10가지 다른 클래스 제공 

이 10개 범주에 대해 각각 50,000개의 이미지가 균등하게 분포(training images)

알고리즘을 테스트해야하는 10,000개의 추가적인 이미지 존재 (testing images)

 

한 쌍의 이미지가 주어지면 실제로 비교하는 방법

 L1 distance (맨해튼 거리)

이미지의 개별 픽셀을 피교 

 

|(test image 픽셀 값) - (training image 픽셀 값) | 을 모든 픽셀에 대해 계산하고 합친 값

L1 distance

 

K-Nearest Neighbors

가장 가까운 이웃을 찾는 대신 K개의 이웃 중에서 더 많이 포함되는 곳으로 선택 함

 

L2(Euclidean) distance

 

훈련 세트 : 레이블이 있는 이미지 세트

검증 세트 : 알고리즘이 얼마나 잘 작동하는지 확인하기 위한 세트 

 

 

Linear Classification

 

Parametric Approach

왼쪽에 있는 고양이의 이미지와

x로 쓰는 이 이미지와

w라고 하는 매개변수 또는 가중치 세트

데이터 x와 매개변수 w를 모두 받는 함수 작성

그러면 cifar의 10개 범주 각각에 해당하는 점수가 나옴

-> 테스트 시간에 훈련 데이터가 필요 없고 이러한 매개변수 w만 필요

 

 

 

반응형
LIST