1. 시계열 자료

1) 개요

- 시계열 자료(time series) : 시간의 흐름에 따라 관찰된 값들

- 시계열 데이터의 분석 목적 : 미래의 값을 예측, 특성 파악(경향, 주기, 계절성, 불규칙성 등)

 

2) 정상성(3가지를 모두 만족)

  • 평균이 일정(모든 시점에서 일정한 평균을 가짐)

평균이 일정하지 않은 시계열은 차분(difference)을 통해 정상화할 수 있다

 

  • 분산도 일정

분산이 일정하지 않을 경우 변환(transformation)을 통해 정상화할 수 있다

 

  • 공분산도 특정 시점에서 t,s에 의존하지 않고 일정

 

> 차분이란?

- 차분은 현시점 자료에서 전 시점 자료를 빼는 것이다

- 일반차분(regular difference) : 바로 전 시점의 자료를 빼는 방법

- 계절차분(seasonal difference) : 여러 시점 전의 자료를 빼는 방법, 주로 계절성을 갖는 자료를 정상화하는데 사용한다

 

분석방법

- 수학적 이론 모형 : 회귀분석(계량경제)방법, Box-Jenkins 방법

- 직관적 방법 : 지수평활법, 시계열 분해법으로 시간에 따른 변동이 느린 데이터 분석에 활용

- 장기예측 : 회귀분석방법 활용

- 단기예측 : Box-Jenkins 방법, 지수평활법, 시계열 분해법 활용

 

자료 형태에 따른 분석 방법

- 일변량 시계열분석 : 시간을 설명변수로 한 하나의 변수에 관심을 갖는 경우의 시계열 분석

- 다중 시계열분석 : 여러개의 시간에 따른 변수들을 활용하는 시계열 분석

예) 계량경제(econometrics) : 시계열 데이터에 대한 회귀분석(예 : 이자율, 인플레이션이 환율에 미치는 요인)

 

  • 이동평균법

- 과거로부터 현재까지의 시계열 자료를 대상으로 일정기간별 이동평균을 계산하고 이들의 추세를 파악하여 다음 기간을 예측하는 방법

- 시계열 자료에서 계절 변동과 불규칙 변동을 제거하여 추세 변동과 순환 변동만 가진 시계열로 변환하는 방법으로도 사용됨

- n개의 시계열 데이터를 m기간으로 이동평균하면 n-m+1개의 이동 평균 데이터가 생성된다

 

- 간단하고 쉽게 미래를 예측할 수 있으며 자료의 수가 많고 안정된 패턴을 보이는 경우 예측의 품질이 높음

- 특정 기간 안에 속하는 시계열에 대해서는 동일한 가중치를 부여함

- 이동 평균에서 가장 중요한 것을 적절한 기간을 사용하는 것

 

  • 지수평활법

- 일정 기간의 평균을 이용하는 이동평균법과 달리 모든 시계열 자료를 사용하여 평균을 구하여 시간의 흐름에 따라 최근 시계열에 더 많은 가중치를 부여하여 미래를 예측하는 방법

- 지수 평활계수가 과거로 갈수록 지수형태로 감소하는 형태인 것을 확인할 수 있다

 

- 단기간에 발생하는 불규칙 변동을 평활하는 방법

- 지수평활법에서 가중치의 역할을 하는 것은 지수평활계수이며 불규칙 변동이 큰 시계열의 경우 지수 평활계수는 작은 값불규칙 변동이 작은 시계열의 경우 큰 값의 지수평활계수를 적용

- 지수평활법은 불규칙변동의 영향을 제거하는 효과가 있으며 중기 예측 이상에 주로 사용됨

 

3) 시계열모형

  • 자기회귀모형(AR, Autoregressive model) : p시점 전의 자료가 현재 자료에 영향을 주는 모형

백색잡음과정(White noise process) : 시계열 분석에서의 오차항을 의미한다

평균이 0 분산이 시그마 제곱, 자기공분산이 0인 경우를 뜻하며 시계열간 확률적 독립일 경우 강 백색잡음 과정이라고 한다 백색잡음 과정이 정규분포를 따를 경우 이를 가우시안(Gaussian)백색 잡음 과정이라고 한다

 

자기상관계수 : k기간 떨어진 값들의 상관계수

부분(편)자기상관계수 : 서로 다른 두 시점 사이의 관계를 분석할 때 중간에 있는 값들의 영향을 제외시킨 상관관계 개념

 

- 자기상관함수는 빠르게 감소하고 부분자기함수는 어느 시점에서 절단점을 가진다

 

  • 이동평균모형(MA, Moving Average model)

유한한 개수의 백색잡음의 결합이므로 언제나 정상성을 만족

 

- AR모형과 반대로 ACF에서 절단점을 갖고 PACF가 빠르게 감소

 

  • 자기회귀누적 이동평균 모형(ARIMA(p,d,q)모형, autogressive integrated moving average model)

- ARIMA 모형은 비정상시계열 모형이다

- ARIMA 모형을 차분이나 변환을 통해 AR모형이나 MA모형, 이 둘을 합친 ARMA 모형으로 정상화할 수 있다

- p는 AR 모형, q는 MA모형과 관련이 있는 차수이다

- 시계열의 d번 차분한 시계열이 ARIMA(p,q) 모형이면 시계열은 차수가 p,d,q인 ARIMA 모형, 즉 ARIMA(p,d,q) 모형을 갖는다고 한다

 

> 가장 간단한 모형을 선택하거나 AIC를 적용하여 점수가 가장 낮은 모형 선택한다

 

4) 분해시계열

시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법(회귀분석적인 방법을 주로 사용한다)

  • 추세요인(Trend factor)

형태가 오르거나 또는 내리는 추세, 선형, 이차식, 지수형태

 

  • 계절요인(Seasonal factor)

요일, 월, 사분기 별로 변화하여 고정된 주기에 따라 자료가 변화

 

  • 순환요인(Cyclical factor)

명백한 경제적, 자연적 이유 없이 알려지지 않은 주기로 자료가 변화

 

  • 불규칙요인

위 세가지 요인으로 설명할 수 없는 회귀분석에서 오차에 해당하는 요인

 

'ADsP > 3과목' 카테고리의 다른 글

4장_5절 다차원 척도법과 주성분분석2  (0) 2022.02.13
4장_5절 다차원 척도법과 주성분분석1  (0) 2022.02.13
4장_3절 회귀분석2  (0) 2022.02.11
4장_3절 회귀분석1  (0) 2022.02.11
4장_2절 기초 통계 분석2  (0) 2022.02.11

+ Recent posts