취미와 밥줄사이

[Machine Learning] - Linear Regression 본문

카테고리 없음

[Machine Learning] - Linear Regression

취미와 밥줄사이 2021. 5. 2. 16:06

Linear Regression 이란


경력과 연봉의 관계를 분석하여, 경력이 주어졌을 떄 연봉을 예측하려 한다.

데이터를 살펴보니, 아래와 같은 그래프로 나왔다고 가정했을 때,

아래 그림처럼, 해당 분포를 만족하는 직선을 찾으려 하는 것이 목표다.

직선을 찾기 위해서는, 우리가 잘 아는 지석의 방정식을 이용하여, 직선의 기울기와 y절편을 구하면 되는 것이다.

여기에서 주의! x,y가 우리에게 데이터셋으로 주어졌다. 따라서 우리는 b를 찾아야 하는 것이다

즉, b0, b1의 값을 찾아 가는 과정을 학습이라고 부른다!

그렇다면 학습이란??? 바로 error(오차)를 줄여나가는 것이다.

아래는 오차를 나타낸다.
그렇다면 오차란?
그리고 직선은 처음에 어디서 가져오지?

모든 관측점(Observation)에서의 y값의 error(오차)가 존재하고, 이 오차들의 총합을 줄여 나가면 된다.

제곱을 하는 이유는??

오차를 줄여 나가서, 최소값이 되는 직선을 찾으면 끝난다.

*최소값이 될떄의 어떤 값을 찾는 것인가?
*

Multiple Linear Regression