1. 시계열 자료
1) 개요
- 시계열 자료(time series) : 시간의 흐름에 따라 관찰된 값들
- 시계열 데이터의 분석 목적 : 미래의 값을 예측, 특성 파악(경향, 주기, 계절성, 불규칙성 등)
2) 정상성(3가지를 모두 만족)
- 평균이 일정(모든 시점에서 일정한 평균을 가짐)
평균이 일정하지 않은 시계열은 차분(difference)을 통해 정상화할 수 있다
- 분산도 일정
분산이 일정하지 않을 경우 변환(transformation)을 통해 정상화할 수 있다
- 공분산도 특정 시점에서 t,s에 의존하지 않고 일정
> 차분이란?
- 차분은 현시점 자료에서 전 시점 자료를 빼는 것이다
- 일반차분(regular difference) : 바로 전 시점의 자료를 빼는 방법
- 계절차분(seasonal difference) : 여러 시점 전의 자료를 빼는 방법, 주로 계절성을 갖는 자료를 정상화하는데 사용한다
분석방법
- 수학적 이론 모형 : 회귀분석(계량경제)방법, Box-Jenkins 방법
- 직관적 방법 : 지수평활법, 시계열 분해법으로 시간에 따른 변동이 느린 데이터 분석에 활용
- 장기예측 : 회귀분석방법 활용
- 단기예측 : Box-Jenkins 방법, 지수평활법, 시계열 분해법 활용
자료 형태에 따른 분석 방법
- 일변량 시계열분석 : 시간을 설명변수로 한 하나의 변수에 관심을 갖는 경우의 시계열 분석
- 다중 시계열분석 : 여러개의 시간에 따른 변수들을 활용하는 시계열 분석
예) 계량경제(econometrics) : 시계열 데이터에 대한 회귀분석(예 : 이자율, 인플레이션이 환율에 미치는 요인)
- 이동평균법
- 과거로부터 현재까지의 시계열 자료를 대상으로 일정기간별 이동평균을 계산하고 이들의 추세를 파악하여 다음 기간을 예측하는 방법
- 시계열 자료에서 계절 변동과 불규칙 변동을 제거하여 추세 변동과 순환 변동만 가진 시계열로 변환하는 방법으로도 사용됨
- n개의 시계열 데이터를 m기간으로 이동평균하면 n-m+1개의 이동 평균 데이터가 생성된다
- 간단하고 쉽게 미래를 예측할 수 있으며 자료의 수가 많고 안정된 패턴을 보이는 경우 예측의 품질이 높음
- 특정 기간 안에 속하는 시계열에 대해서는 동일한 가중치를 부여함
- 이동 평균에서 가장 중요한 것을 적절한 기간을 사용하는 것
- 지수평활법
- 일정 기간의 평균을 이용하는 이동평균법과 달리 모든 시계열 자료를 사용하여 평균을 구하여 시간의 흐름에 따라 최근 시계열에 더 많은 가중치를 부여하여 미래를 예측하는 방법
- 지수 평활계수가 과거로 갈수록 지수형태로 감소하는 형태인 것을 확인할 수 있다
- 단기간에 발생하는 불규칙 변동을 평활하는 방법
- 지수평활법에서 가중치의 역할을 하는 것은 지수평활계수이며 불규칙 변동이 큰 시계열의 경우 지수 평활계수는 작은 값을 불규칙 변동이 작은 시계열의 경우 큰 값의 지수평활계수를 적용함
- 지수평활법은 불규칙변동의 영향을 제거하는 효과가 있으며 중기 예측 이상에 주로 사용됨
3) 시계열모형
- 자기회귀모형(AR, Autoregressive model) : p시점 전의 자료가 현재 자료에 영향을 주는 모형
백색잡음과정(White noise process) : 시계열 분석에서의 오차항을 의미한다
평균이 0 분산이 시그마 제곱, 자기공분산이 0인 경우를 뜻하며 시계열간 확률적 독립일 경우 강 백색잡음 과정이라고 한다 백색잡음 과정이 정규분포를 따를 경우 이를 가우시안(Gaussian)백색 잡음 과정이라고 한다
자기상관계수 : k기간 떨어진 값들의 상관계수
부분(편)자기상관계수 : 서로 다른 두 시점 사이의 관계를 분석할 때 중간에 있는 값들의 영향을 제외시킨 상관관계 개념
- 자기상관함수는 빠르게 감소하고 부분자기함수는 어느 시점에서 절단점을 가진다
- 이동평균모형(MA, Moving Average model)
유한한 개수의 백색잡음의 결합이므로 언제나 정상성을 만족
- AR모형과 반대로 ACF에서 절단점을 갖고 PACF가 빠르게 감소
- 자기회귀누적 이동평균 모형(ARIMA(p,d,q)모형, autogressive integrated moving average model)
- ARIMA 모형은 비정상시계열 모형이다
- ARIMA 모형을 차분이나 변환을 통해 AR모형이나 MA모형, 이 둘을 합친 ARMA 모형으로 정상화할 수 있다
- p는 AR 모형, q는 MA모형과 관련이 있는 차수이다
- 시계열의 d번 차분한 시계열이 ARIMA(p,q) 모형이면 시계열은 차수가 p,d,q인 ARIMA 모형, 즉 ARIMA(p,d,q) 모형을 갖는다고 한다
> 가장 간단한 모형을 선택하거나 AIC를 적용하여 점수가 가장 낮은 모형 선택한다
4) 분해시계열
시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법(회귀분석적인 방법을 주로 사용한다)
- 추세요인(Trend factor)
형태가 오르거나 또는 내리는 추세, 선형, 이차식, 지수형태
- 계절요인(Seasonal factor)
요일, 월, 사분기 별로 변화하여 고정된 주기에 따라 자료가 변화
- 순환요인(Cyclical factor)
명백한 경제적, 자연적 이유 없이 알려지지 않은 주기로 자료가 변화
- 불규칙요인
위 세가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인
'ADsP > 3과목' 카테고리의 다른 글
4장_5절 다차원 척도법과 주성분분석2 (0) | 2022.02.13 |
---|---|
4장_5절 다차원 척도법과 주성분분석1 (0) | 2022.02.13 |
4장_3절 회귀분석2 (0) | 2022.02.11 |
4장_3절 회귀분석1 (0) | 2022.02.11 |
4장_2절 기초 통계 분석2 (0) | 2022.02.11 |