벡터자기회귀 모형(Vector AutoRegressive Model)이란?
- 벡터자기회귀모형(Vector AutoRegressive Model, VAR)은 일변량 자기회귀모형을 다변량 자기회귀모형으로 확정시킨 모형으로 예측 및 내생변수의 변화에 따른 효과 분석 등과 관련하여 자주 활용되고 있음
- ARIMA 모형보다 좀 더 다변량의 효과를 모델링한 모형이라고 이해됨
- 다변량 분석 시 예측할 변수의 과거 데이터를 고려할 뿐 아니라 여러 변수 사이의 의존성 또한 고려해야함
- 일변량 분석인 ARIMA 모형은 변수들 사이 상호작용을 무시하는 반면 VAR는 이를 고려하여 모델링함
언제 사용하는가?
- 예측뿐만 아니라 특정 변수의 일시적 충격에 대한 효과를 모델링하기 위해 연립방정식 체계로 구성된 VAR 모형을 이용할 수 있음
어느 분야 자주 사용하는가?
- 경제 분야에서 자주 사용됨
- 수출 상품의 수요예측에도 사용되고 있음
왜 사용해야 하는가?
Sims(1980)의 VAR 모형은 아래와 같은 한계를 보완하고자 고안한 모형이다.
- 회귀분석은 시간 t가 변하더라도 항상 일정하다는 가정이 있음
- 시계열 분석은 단변량 분석이기 때문에 변수 간의 상호작용을 고려하지 못함
모형의 장점
- 충격반응분석을 장점으로 설명하고 있고 어떤 변수가 변할 때 내생 변수에 미치는 효과를 파악 가능하다.
- 분산분해를 통하여 각각 내생변수의 변동 중에 이들 변수들이 전체 변동에 기여한 부분이 어느 정도인지 상대적 크기를 분석 가능하다.
모델 활용
- VAR 모형은 경제이론을 기초로 함
- 실제 관찰되는 경제 시계열 자료를 최대로 이용하여 현실 경제를 분석 가능함
VAR 모형에 대한 이해
정상성(Stationarity) 가정
- 공간 분석 모형과 비슷하게 정상성 가정하에 모델링을 할 수밖에 없음
- 왜냐하면 특정 t 시점에 관측된 값은 분포 값 가운데 단 하나의 값이므로, 특정 t 시점에 대한 분포를 추정하지 못한다는 한계를 지니기 때문 (즉, 관측치 하나로 분포를 추정하는 것은 불가능하기 때문)
시간 $t=1, 2, \cdots, T$에 대해, 다변량 시계열 $X_t = (X_{1t}, X_{2t}, \cdots, X_{Nt})$의 정상성(Stationarity) 조건은 아래와 같다.
$1) E(X_t) = \mu < \infty $
$2) Var(X_t) = E[(X_t - \mu){(X_t - \mu)}'] = \Sigma _X < \infty $
$3) Cov(X_t, X_{t+k}) = E[(X_t - \mu){(X_{t+k} - \mu)}'] = T_X(k) $
VAR 모형
$N$개의 다변량 정상시계열로 구성된 $X_t = (X_{1t}, X_{2t}, \cdots, X_{Nt})$가 p시차인 자기회귀과정으로 구성된 벡터자기회귀모형 ( VAR(p) )는 아래와 같이 정의할 수 있다.
$\begin{matrix}
X_t & = & C + \Theta_1 X_{t-1} + \cdots + \Theta_p X_{t-p} + \varepsilon_t\\
& = & C + \sum\limits_{i=1}^{p} \Theta_i X_{t-i}+\varepsilon_t
\end{matrix}$
여기서 $C$는 $(N\times 1)$ 상수벡터, $\Theta_i$는 현시점의 변수와 시차변수들 간 시차회귀 계수인 $(N\times N)$의 행렬, $\varepsilon_t$는 $(N\times1)$의 벡터백색잡음과정으로 $E(\varepsilon_t)=0$이며, 다음 공분산행렬을 갖는다.
$\Sigma_{\varepsilon} = \Sigma(\varepsilon_t {\varepsilon}'_s) = \left\{\begin{matrix}
\sigma ^2, & \ \ where \ \ t=s \\
0, & \ \ o.w
\end{matrix}\right.$
$X$의 벡터회귀방정식은 $N$개의 개별 회귀방정식을 갖게 되며, 개별 회귀방정식의 모수 $\Theta_n$은 통상최소자승법(Ordinary Least square method: OLS)을 활용하여 추정함.
모형 설계 시 고려사항
- 한 변수가 변했을 때 시간에 따라 다른 변수에 어떻게 영향을 미치는가를 파악하기 위해서 연립 방정식 체계로 변환하였을 때는 구조적 불안정이 초래되어 그 해의 의미가 없을 수 있다고 함
- 또한 연립방정식 체계는 변수 선정 및 개별 방정식 설정에 신중을 기해야 함
- 어떠한 경제이론을 근거로 변수를 이용하기 때문에 비교적 적은 수의 변수로 모형을 설계할 수 있다는 장점이 있음
- 모형 설계 시 표본 기간, 사용될 변수 및 변수의 순서, 시차 길이에 의해서 결과가 달라질 수 있음
참고
문권순, 벡터자기회귀(VAR)모형의 이해 , 통계청『통계분석연구』제2권 제1호(‘97.봄)23-56