La autorregresión vectorial ( VAR ) es un modelo estadístico que se utiliza para capturar la relación entre múltiples cantidades a medida que cambian con el tiempo. VAR es un tipo de modelo de proceso estocástico . Los modelos VAR generalizan el modelo autorregresivo de una sola variable (univariado) al permitir series temporales multivariadas . Los modelos VAR se utilizan a menudo en economía y ciencias naturales .
Al igual que el modelo autorregresivo, cada variable tiene una ecuación que modela su evolución a lo largo del tiempo. Esta ecuación incluye los valores rezagados (pasados) de la variable, los valores rezagados de las otras variables del modelo y un término de error . Los modelos VAR no requieren tanto conocimiento sobre las fuerzas que influyen en una variable como los modelos estructurales con ecuaciones simultáneas . El único conocimiento previo necesario es una lista de variables que se puede suponer que se afectan entre sí a lo largo del tiempo.
Un modelo VAR describe la evolución de un conjunto de k variables, llamadas variables endógenas , a lo largo del tiempo. Cada período de tiempo está numerado, t = 1, ..., T. Las variables se recogen en un vector , y t , que tiene una longitud k. (De manera equivalente, este vector podría describirse como una matriz ( k × 1) . ) El vector se modela como una función lineal de su valor anterior. Los componentes del vector se denominan y i , t , lo que significa la observación en el momento t de la i ésima variable. Por ejemplo, si la primera variable del modelo mide el precio del trigo a lo largo del tiempo, entonces y 1,1998 indicaría el precio del trigo en el año 1998.
Los modelos VAR se caracterizan por su orden , que se refiere al número de períodos de tiempo anteriores que utilizará el modelo. Siguiendo con el ejemplo anterior, un VAR de quinto orden modelaría el precio del trigo de cada año como una combinación lineal de los precios del trigo de los últimos cinco años. Un rezago es el valor de una variable en un período de tiempo anterior. Por lo tanto, en general, un VAR de orden p se refiere a un modelo VAR que incluye rezagos para los últimos p períodos de tiempo. Un VAR de orden p se denota como "VAR( p )" y, a veces, se lo denomina "un VAR con p rezagos". Un modelo VAR de orden p se escribe como
Las variables de la forma y t −i indican el valor de esa variable i períodos de tiempo antes y se denominan el "i ésimo rezago" de y t . La variable c es un k -vector de constantes que sirve como intersección del modelo. A i es una matriz ( k × k ) invariante en el tiempo y e t es un k -vector de términos de error . Los términos de error deben satisfacer tres condiciones:
El proceso de elección del rezago máximo p en el modelo VAR requiere atención especial porque la inferencia depende de la exactitud del orden de rezago seleccionado. [2] [3]
Tenga en cuenta que todas las variables deben ser del mismo orden de integración . Los siguientes casos son distintos:
Se pueden apilar los vectores para escribir una VAR( p ) como una ecuación de diferencia matricial estocástica , con una notación matricial concisa:
Los detalles de las matrices están en una página aparte.
Para ver un ejemplo general de un VAR( p ) con k variables, consulte Notación matricial general de un VAR(p).
Una VAR(1) en dos variables se puede escribir en forma matricial (notación más compacta) como
(en la que sólo aparece una única matriz A porque este ejemplo tiene un rezago máximo p igual a 1), o, equivalentemente, como el siguiente sistema de dos ecuaciones
Cada variable del modelo tiene una ecuación. La observación actual (tiempo t ) de cada variable depende de sus propios valores rezagados, así como de los valores rezagados de cada una de las demás variables del VAR.
Un VAR con p rezagos siempre se puede reescribir de forma equivalente como un VAR con un solo rezago redefiniendo adecuadamente la variable dependiente. La transformación equivale a apilar los rezagos de la variable VAR( p ) en la nueva variable dependiente VAR(1) y agregar identidades para completar la cantidad precisa de ecuaciones.
Por ejemplo, el modelo VAR(2)
puede reformularse como el modelo VAR(1)
donde I es la matriz identidad .
La forma equivalente VAR(1) es más conveniente para derivaciones analíticas y permite declaraciones más compactas.
Un VAR estructural con p rezagos (a veces abreviado SVAR ) es
donde c 0 es un vector k × 1 de constantes, B i es una matriz k × k (para cada i = 0, ..., p ) y ε t es un vector k × 1 de términos de error . Los términos diagonales principales de la matriz B 0 (los coeficientes de la i ésima variable en la i ésima ecuación) se escalan a 1.
Los términos de error ε t ( shocks estructurales ) satisfacen las condiciones (1) - (3) de la definición anterior, con la particularidad de que todos los elementos en la diagonal exterior de la matriz de covarianza son cero. Es decir, los shocks estructurales no están correlacionados.
Por ejemplo, una estructura VAR(1) de dos variables es:
dónde
es decir, las varianzas de los shocks estructurales se denotan ( i = 1, 2) y la covarianza es .
Escribiendo la primera ecuación explícitamente y pasando y 2,t al lado derecho se obtiene
Obsérvese que y 2, t puede tener un efecto contemporáneo sobre y 1, t si B 0; 1, 2 no es cero. Esto es diferente del caso en el que B 0 es la matriz identidad (todos los elementos fuera de la diagonal son cero, el caso en la definición inicial), cuando y 2, t puede afectar directamente a y 1, t +1 y los valores futuros subsiguientes, pero no a y 1, t .
Debido al problema de identificación de parámetros , la estimación por mínimos cuadrados ordinarios del VAR estructural produciría estimaciones de parámetros inconsistentes . Este problema se puede superar reescribiendo el VAR en forma reducida.
Desde un punto de vista económico, si la dinámica conjunta de un conjunto de variables puede representarse mediante un modelo VAR, entonces la forma estructural es una representación de las relaciones económicas "estructurales" subyacentes. Dos características de la forma estructural la convierten en la candidata preferida para representar las relaciones subyacentes:
Premultiplicando el VAR estructural por el inverso de B 0
y denotando
Se obtiene el VAR reducido de orden p
Obsérvese que en la forma reducida todas las variables del lado derecho están predeterminadas en el momento t . Como no hay variables endógenas en el momento t en el lado derecho, ninguna variable tiene un efecto contemporáneo directo sobre otras variables del modelo.
Sin embargo, los términos de error en el VAR reducido son compuestos de los shocks estructurales e t = B 0 −1 ε t . Por lo tanto, la ocurrencia de un shock estructural ε i,t puede potencialmente conducir a la ocurrencia de shocks en todos los términos de error e j,t , creando así un movimiento contemporáneo en todas las variables endógenas. En consecuencia, la matriz de covarianza del VAR reducido
Puede tener elementos fuera de la diagonal distintos de cero, lo que permite una correlación distinta de cero entre los términos de error.
Partiendo de la notación matricial concisa (para más detalles véase este anexo):
Esto se puede escribir alternativamente como:
donde denota el producto de Kronecker y Vec la vectorización de la matriz indicada.
Este estimador es consistente y asintóticamente eficiente . Además, es igual al estimador de máxima verosimilitud condicional . [4]
Como en el caso estándar, el estimador de máxima verosimilitud (MLE) de la matriz de covarianza difiere del estimador de mínimos cuadrados ordinarios (MCO).
Estimador MLE: [ cita requerida ]
Estimador MCO: [ cita requerida ] para un modelo con una constante, k variables y p rezagos.
En una notación matricial, esto da:
La matriz de covarianza de los parámetros se puede estimar como [ cita requerida ]
Los modelos de autorregresión vectorial suelen implicar la estimación de muchos parámetros. Por ejemplo, con siete variables y cuatro rezagos, cada matriz de coeficientes para una longitud de rezago dada es de 7 por 7, y el vector de constantes tiene 7 elementos, por lo que se estima un total de 49×4 + 7 = 203 parámetros, lo que reduce sustancialmente los grados de libertad de la regresión (el número de puntos de datos menos el número de parámetros que se van a estimar). Esto puede perjudicar la precisión de las estimaciones de los parámetros y, por lo tanto, de los pronósticos proporcionados por el modelo.
Consideremos el caso de primer orden (es decir, con un solo rezago), con ecuación de evolución
Para el vector de evolución (estado) y el vector de choques, por ejemplo, para hallar el efecto del j -ésimo elemento del vector de choques sobre el i -ésimo elemento del vector de estado 2 períodos después, que es una respuesta al impulso particular, primero escriba la ecuación de evolución anterior con un período de retraso:
Utilice esto en la ecuación original de la evolución para obtener
Luego repita usando la ecuación de evolución dos veces rezagada, para obtener
A partir de esto, el efecto del componente j -ésimo de sobre el componente i -ésimo de es el elemento i, j de la matriz
Se puede ver a partir de este proceso de inducción que cualquier choque tendrá un efecto sobre los elementos de y infinitamente lejos en el tiempo, aunque el efecto será cada vez más pequeño con el tiempo suponiendo que el proceso AR es estable, es decir, que todos los valores propios de la matriz A son menores que 1 en valor absoluto .
Se puede utilizar un modelo VAR estimado para realizar pronósticos y se puede juzgar la calidad de los pronósticos de maneras completamente análogas a los métodos utilizados en el modelado autorregresivo univariado.
Christopher Sims ha defendido los modelos VAR, criticando las afirmaciones y el rendimiento de los modelos anteriores en econometría macroeconómica . [6] Recomendó los modelos VAR, que habían aparecido previamente en estadísticas de series de tiempo y en identificación de sistemas , una especialidad estadística en teoría de control . Sims defendió los modelos VAR como un método libre de teoría para estimar relaciones económicas, siendo así una alternativa a las "increíbles restricciones de identificación" en los modelos estructurales. [6] Los modelos VAR también se utilizan cada vez más en la investigación de la salud para análisis automáticos de datos de diarios [7] o datos de sensores.