En el análisis estadístico de series temporales , los modelos autorregresivos de promedio móvil ( ARMA ) son una forma de describir un proceso estocástico (débilmente) estacionario utilizando autorregresión (AR) y un promedio móvil (MA), cada uno con un polinomio. Son una herramienta para comprender una serie y predecir valores futuros. AR implica la regresión de la variable sobre sus propios valores rezagados (es decir, pasados). MA implica modelar el error como una combinación lineal de términos de error que ocurren contemporáneamente y en varios momentos en el pasado. El modelo generalmente se denota ARMA( p , q ), donde p es el orden de AR y q es el orden de MA.
El modelo general ARMA fue descrito en la tesis de 1951 de Peter Whittle , Pruebas de hipótesis en análisis de series de tiempo , y se popularizó en el libro de 1970 de George EP Box y Gwilym Jenkins .
Los modelos ARMA se pueden estimar utilizando el método Box-Jenkins .
La notación AR( p ) se refiere al modelo autorregresivo de orden p . El modelo AR( p ) se escribe como
donde son parámetros y la variable aleatoria es ruido blanco , generalmente variables aleatorias normales independientes e idénticamente distribuidas (iid) . [1] [2]
Para que el modelo permanezca estacionario , las raíces de su polinomio característico deben estar fuera del círculo unitario. Por ejemplo, los procesos en el modelo AR(1) con no son estacionarios porque la raíz de se encuentra dentro del círculo unitario. [3]
La prueba aumentada de Dickey-Fuller evalúa la estabilidad de los componentes de tendencia y del FMI. Para las series temporales estacionarias, se utiliza el modelo ARMA, mientras que para las series no estacionarias, se utilizan los modelos LSTM para derivar características abstractas. El valor final se obtiene reconstruyendo los resultados previstos de cada serie temporal.
La notación MA( q ) se refiere al modelo de media móvil de orden q :
donde son los parámetros del modelo, es la expectativa de (que a menudo se supone que es igual a 0), y , ..., son términos de error de ruido blanco iid que comúnmente son variables aleatorias normales. [4]
La notación ARMA( p , q ) se refiere al modelo con p términos autorregresivos y q términos de promedio móvil. Este modelo contiene los modelos AR( p ) y MA( q ), [5]
En algunos textos, los modelos se especifican utilizando el operador de retardo L . En estos términos, el modelo AR( p ) se da por
donde representa el polinomio
El modelo MA( q ) está dado por
donde representa el polinomio
Finalmente, el modelo combinado ARMA( p , q ) viene dado por
o más concisamente,
o
Esta es la forma utilizada en Box , Jenkins y Reinsel. [6]
Además, si comenzamos las sumas desde y estableciendo y , obtenemos una formulación aún más elegante:
La densidad espectral de un proceso ARMA es donde es la varianza del ruido blanco, es el polinomio característico de la parte de promedio móvil del modelo ARMA y es el polinomio característico de la parte autorregresiva del modelo ARMA. [7] [8]
Se puede encontrar un valor apropiado de p en el modelo ARMA( p , q ) al trazar las funciones de autocorrelación parcial . De manera similar, q se puede estimar utilizando las funciones de autocorrelación . Tanto p como q se pueden determinar simultáneamente utilizando funciones de autocorrelación extendidas (EACF). [9] Se puede obtener más información considerando las mismas funciones para los residuos de un modelo ajustado con una selección inicial de p y q .
Brockwell y Davis recomiendan utilizar el criterio de información de Akaike (AIC) para encontrar p y q . [10] Otra opción es el criterio de información bayesiano (BIC).
Después de elegir p y q, los modelos ARMA se pueden ajustar mediante regresión de mínimos cuadrados para encontrar los valores de los parámetros que minimizan el término de error. Es una buena práctica encontrar los valores más pequeños de p y q que proporcionen un ajuste aceptable a los datos. Para un modelo AR puro, se pueden utilizar las ecuaciones de Yule-Walker para proporcionar un ajuste.
Los resultados de ARMA se utilizan principalmente para pronosticar (predecir), y no para inferir causalidad como en otras áreas de la econometría y métodos de regresión como MCO y 2SLS.
stats
tiene la función arima
, documentada en ARIMA Modelling of Time Series. El paquete astsa tiene un script mejorado llamado sarima
para ajustar modelos ARMA (estacionales y no estacionales) y sarima.sim
para simular datos de estos modelos. Los paquetes de extensión contienen funcionalidades relacionadas y extendidas: el paquete tseries
incluye la función arma()
, documentada en "Fit ARMA Models to Time Series"; el paquete fracdiff contiene fracdiff()
para procesos ARMA integrados fraccionariamente; y el paquete forecast incluye auto.arima
para seleccionar un conjunto parsimonioso de p, q . La vista de tareas de CRAN sobre series temporales contiene enlaces a la mayoría de estos.statsmodels
paquete S, que incluye muchos modelos y funciones para el análisis de series temporales, incluido ARMA. Anteriormente formaba parte de la biblioteca scikit-learn , pero ahora es independiente y se integra bien con Pandas .arima
. para los modelos ARMA y ARIMA .El modelo ARMA general fue descrito en la tesis de 1951 de Peter Whittle , quien utilizó el análisis matemático ( series de Laurent y análisis de Fourier ) y la inferencia estadística. [12] [13] Los modelos ARMA se popularizaron gracias a un libro de 1970 de George EP Box y Jenkins, quien expuso un método iterativo ( Box–Jenkins ) para elegirlos y estimarlos. Este método fue útil para polinomios de orden bajo (de grado tres o menos). [14]
ARMA es esencialmente un filtro de respuesta de impulso infinito aplicado al ruido blanco, al que se le agrega alguna interpretación adicional.
En el procesamiento de señales digitales , ARMA se representa como un filtro digital con ruido blanco en la entrada y el proceso ARMA en la salida.
El ARMA es apropiado cuando un sistema es una función de una serie de shocks no observados (la media móvil o parte del promedio móvil) así como de su propio comportamiento. Por ejemplo, los precios de las acciones pueden verse afectados por información fundamental y exhibir efectos de tendencia técnica y reversión a la media debido a los participantes del mercado. [ cita requerida ]
Existen varias generalizaciones de ARMA. La AR no lineal (NAR), la MA no lineal (NMA) y la ARMA no lineal (NARMA) modelan la dependencia no lineal de valores pasados y términos de error. La AR vectorial (VAR) y la ARMA vectorial (VARMA) modelan series temporales multivariadas . La media móvil autorregresiva integrada (ARIMA) modela series temporales no estacionarias (es decir, cuya media cambia con el tiempo). La heterocedasticidad condicional autorregresiva (ARCH) modela series temporales donde la varianza cambia. La ARIMA estacional (SARIMA o ARMA periódica) modela la variación periódica . La media móvil autorregresiva integrada fraccionalmente (ARFIMA, o ARIMA fraccional, FARIMA) modela series temporales que exhiben memoria larga . La AR multiescala (MAR) está indexada por los nodos de un árbol en lugar de números enteros.
La notación ARMAX( p , q , b ) se refiere a un modelo con p términos autorregresivos, q términos de promedio móvil y b términos de entradas exógenas. El último término es una combinación lineal de los últimos b términos de una serie temporal conocida y externa . Viene dada por:
¿Dónde están los parámetros de la entrada exógena ?
Se han definido algunas variantes no lineales de modelos con variables exógenas: véase por ejemplo Modelo exógeno autorregresivo no lineal .
Los paquetes estadísticos implementan el modelo ARMAX mediante el uso de variables "exógenas" (es decir, independientes). Se debe tener cuidado al interpretar la salida de esos paquetes, porque los parámetros estimados generalmente (por ejemplo, en R [15] y gretl ) hacen referencia a la regresión:
donde incorpora todas las variables exógenas (o independientes):