선형회귀란 데이터들의 동향을 일차함수에 근사시키는 분석법이다.
데이터가 3개 이상일때 유의미하다. 당연하겠지?
데이터의 경향성이 특정한 직선을 따를 것이라는 가설을 세웠을 때, 비용은 각 점과의 거리가 클수록 큰 것이 옳을것이다.
그래서 예측값-실제값 의 제곱의 평균을 활용하여 비용함수를 구할 수 있다.
경사하강을 이용해 합리적인 식을 도출하자.
우리의 가설인 직선함수는 H(x)=Wx라고 쓸 수 있다. 이때 비용함수는
(Wx-y)^2을 따른다. 비용함수를 그래프로 그려보면
x축을 W, y축을 비용으로 하면 2차함수를 그린다.
이때 비용이 가장 적도록 하는 W값이 가장 좋은 추정값이라고 할 수 있다.
여기서 미분의 개념이 들어간다.
실제로는 미분을 해서 해를 찾아내지는 않고,
미분한 값을 통해 W값이 점프하는 방식으로 학습을 한다.
점프의 폭이 너무 작으면 학습이 오래 걸릴 것이며
점프의 폭이 너무 크면 학습 결과가 부정확할 수 있다.
텐서플로우는 경사 하강 라이브러리를 제공한다.
원리만 이해해도 충분하고 구현은 텐서플로우가 해준다.
아 텐서플로 버전 바뀌면서 session이 사라져서 학습 컨텐츠를 활용하기가 너무 힘드네
'📁study archive > ML DL' 카테고리의 다른 글
딥러닝2차시 (0) | 2022.08.28 |
---|---|
딥러닝1차시 (0) | 2022.08.28 |
댓글