일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 에러
- 아나콘다
- 기초
- 깃허브
- 리눅스
- 디렉토리
- 코랩
- 데이터베이스
- 라이브러리
- OpenCV
- 예제
- 플라스크
- 역할
- 데이터분석
- 단축키
- 운영체제
- vscode
- 머신러닝
- 우분투
- visual studio code
- SQL
- 프로그래머스
- matplotlib
- 가상환경
- 디버깅
- 엑셀
- 파이썬
- 원격저장소
- MySQL
- 판다스
Archives
- Today
- Total
취미와 밥줄사이
[Machine Learning] - Linear Regression 본문
Linear Regression 이란
경력과 연봉의 관계를 분석하여, 경력이 주어졌을 떄 연봉을 예측하려 한다.
데이터를 살펴보니, 아래와 같은 그래프로 나왔다고 가정했을 때,
아래 그림처럼, 해당 분포를 만족하는 직선을 찾으려 하는 것이 목표다.
직선을 찾기 위해서는, 우리가 잘 아는 지석의 방정식을 이용하여, 직선의 기울기와 y절편을 구하면 되는 것이다.
여기에서 주의! x,y가 우리에게 데이터셋으로 주어졌다. 따라서 우리는 b를 찾아야 하는 것이다
즉, b0, b1의 값을 찾아 가는 과정을 학습이라고 부른다!
그렇다면 학습이란??? 바로 error(오차)를 줄여나가는 것이다.
아래는 오차를 나타낸다.
그렇다면 오차란?
그리고 직선은 처음에 어디서 가져오지?
모든 관측점(Observation)에서의 y값의 error(오차)가 존재하고, 이 오차들의 총합을 줄여 나가면 된다.
제곱을 하는 이유는??
오차를 줄여 나가서, 최소값이 되는 직선을 찾으면 끝난다.
*최소값이 될떄의 어떤 값을 찾는 것인가?
*