Post

Supervised, Unsupervised / Linear Regression

ANN에서 문제를 해결하는 방식은 두 단계로 이루어져 있다.

  1. 학습 : 학습 데이터를 이용해 가중치 매개변수를 학습한다. (지도 학습, SL(Supervised learning))
  2. 추론 : 학습한 가중치 매개변수를 이용해 입력 데이터에 대한 결과를 추측한다. 추론은 다시 분류(Classification)와 회귀(Regression)로 나뉜다.

Supervised, Unsupervised

지도 학습과 비지도 학습의 차이는, 학습 데이터가 라벨링되어 있느냐이다. 라벨링되어 있는 경우 데이터를 어떻게 분류해야 할 지를 알고 있으므로 주어진 데이터를 올바른 곳에 분류하게 된다. 그러나 비지도 학습의 경우 데이터가 라벨링되어 있지 않기 때문에 비슷한 특징을 가진 데이터들 끼리 묶을 수는 있겠지만, 이 데이터가 무엇을 의미하는지는 알지 못한다. 신경망(딥러닝)에서는 일부 데이터는 라벨링 처리해서 지도 학습을 수행하고, 나머지 데이터에 대해 비지도 학습을 수행한다.

Unsupervised learning의 예 ) news grouping이나 word clustering

회귀 ( Regression )

Regression은 쉽게 말하면 곡선 근사다. linear regression은 \(H(x) = Wx + b\)로 그려지는 직선으로 근사하는 것을 말한다. e.g) 공부 시간에 따른 시험 점수 예측 목표는 \(minimize\ cost(W, b)\)로 Classification과 동일하다.

This post is licensed under CC BY 4.0 by the author.