ADsP/3과목
4장_3절 회귀분석1
hyerimir
2022. 2. 11. 14:27
1. 회귀분석의 개요
1) 정의
- 하나 또는 그 이상의 독립변수들이 종속변수에 미치는 영향을 추정할 수 있는 통계 기법
- 독립변수가 1개 : 단순선형회귀분석, 독립변수가 2개 이상 : 다중선형회귀분석
- 최소제곱법 : 측정값을 기초로 제곱 합을 만들고 그것의 최소인 값을 구하여 처리하는 방법, 잔차 제곱이 가장 작은 선을 선택
2) 회귀분석의 검정
- 회귀식(모형)에 대한 검증 : F-검증
- 회귀계수들에 대한 검증 : t-검증
- 모형의 설명력은 결정계수(R^2)으로 알 수 있으며 회귀제곱합/전체제곱합 = SSR/SST, 0<=R^2<= 1
- 단순회귀분석의 결정계수는 상관계수 값의 제곱과 같음
3) 선형회귀분석
가정
- 선형성 : 입력변수와 출력변수의 관계가 선형
- 독립성 : 잔차와 독립변인은 관련이 없음
- 등분산성 : 독립변인의 모든 값에 대한 오차들의 분산이 일정
- 비상관성 : 관측치들의 잔차들끼리 상관이 없어야 함
- 정상성 : 잔차항이 정규분포를 이뤄야 함
다중선형회귀분석의 다중공선성(multicollinearity)
- 다중회귀분석에서 설명변수들 사이에 선형관계가 존재하면 회귀계수의 정확한 추정이 곤란
- 분산팽창요인(VIF) : 10보다 크면 심각한 문제; 10이상이면 문제가 있다고 보고 30보다 크면 심각, 선형관계가 강한 변수는 제거