2. 인과관계의 이해
1) 용어
종속변수(반응변수, y) : 다른 변수의 영향을 받는 변수
독립변수(설명변수, x) : 영향을 주는 변수
산점도(scatter plot) : 좌표평면 위에 점들로 표현한 그래프
- 산점도에서 확인 할 수 있는 것
두 변수 사이에 선형관계가 성립하는가?
두 변수 사이의 함수관계가 성립하는가?
이상값의 존재 여부와 몇 개의 집단으로 구분되는지를 확인
2) 공분산(covariace)
두 확률변수 X,Y의 방향의 조합(선형성)
공분산의 부호만으로 두 변수간의 방향성을 확인할 수 있다
X,Y가 독립이면 이때 공분산은 0이다
3. 상관분석(correlation analysis)
1) 정의와 특성
두 변수 간의 관계의 정도를 알아보기 위한 분석방법
상관계수가 1에 가까울수록 강한 양의 상관관계, 상관계수가 -1에 가까울수록 강한 음의 상관관계를 가짐
상관계수가 0인 경우 데이터 간의 상관이 없음
2) 유형
- 피어슨
- 등간척도 이상으로 측정된 두 변수의 상관관계 측정
- 연속형 변수, 정규성 가정
- 피어슨 r(적률상관계수)
- 스피어만
- 순서, 서열 척도인 두 변수들 간의 상관관계를 측정
- 순서형 변수, 비모수적 방법
- 순위상관계수 p(로우)
-> R코드 : cor(x, y, method = c('pearson', 'kendall', 'spearman'))
'ADsP > 3과목' 카테고리의 다른 글
4장_3절 회귀분석2 (0) | 2022.02.11 |
---|---|
4장_3절 회귀분석1 (0) | 2022.02.11 |
4장_2절 기초 통계 분석1 (0) | 2022.02.11 |
4장_1절 통계분석의 이해2 (0) | 2022.02.11 |
4장_1절 통계분석의 이해1 (0) | 2022.02.11 |