본문 바로가기

다중선형회귀

[Machine Learning] 지도학습 - 다중선형회귀 vs 다항선형회귀 Multiple Linear Regression(다중선형회귀) Multiple Linear Regression(다중선형회귀)는 종속변수는 그대로 하나이지만 독립변수가 두 개 이상인 경우를 의미. 예를 들어, 아파트 집 값(종속변수)에 미치는 변수(독립변수)가 위치, 평수, 층수, 년식 등등 많은 경우이다. 다중선형회귀에서는 두개이상의 독립변수가 서로 연관관계에 있을때 결과가 제대로 나오지 않는 문제가 있다. (다중공선성) Multicolinearity (다중공선성) 두 개 이상의 독립변수가 서로 correlated 되었을 때 Multiple Linear Regression 결과가 정확하게 나오지 않는 것. 다중공선성 확인은 분산팽창지수 (Variation Inflation Factor ; VIF) 로 확.. 더보기
[Machine Learning] 지도학습 - 선형회귀(Linear Regression) 종속변수 y 와 한개 이상의 독립변수 X와의 선형 상관관계를 모델링 하는 회기분석(예측) 기법. 오류를 최소화 하거나 가능한 작게 만드는것 종속변수 y = Response 변수, Label, Target 독립변수 X = Predictor, Explanatory, feature (주로 Matrix라서 대문자 X) 선형회귀를 사용하는 목적 Data값 예측 선형 회귀를 사용해 데이터에 적합한 예측 모형을 개발한다. 개발한 선형 회귀식을 사용해 y가 없는 x값에 대해 y를 예측하기 위해 사용할 수 있다. Data간의 관계 예측 종속 변수 y와 이것과 연관된 독립 변수 X1, ..., Xp가 존재하는 경우에, 선형 회귀 분석을 사용해 Xj와 y의 관계를 정량화할 수 있다. Xj는 y와 전혀 관계가 없을 수도 있고.. 더보기