Modelo estadístico utilizado en el análisis de series temporales
En el análisis estadístico de series temporales , los modelos autorregresivos de promedio móvil ( ARMA ) son una forma de describir un proceso estocástico (débilmente) estacionario utilizando autorregresión (AR) y un promedio móvil (MA), cada uno con un polinomio. Son una herramienta para comprender una serie y predecir valores futuros. AR implica la regresión de la variable sobre sus propios valores rezagados (es decir, pasados). MA implica modelar el error como una combinación lineal de términos de error que ocurren contemporáneamente y en varios momentos en el pasado. El modelo generalmente se denota ARMA( p , q ), donde p es el orden de AR y q es el orden de MA.
El modelo general ARMA fue descrito en la tesis de 1951 de Peter Whittle , Pruebas de hipótesis en análisis de series de tiempo , y se popularizó en el libro de 1970 de George EP Box y Gwilym Jenkins .
Los modelos ARMA se pueden estimar utilizando el método Box-Jenkins .
Formulación matemática
Modelo autorregresivo
La notación AR( p ) se refiere al modelo autorregresivo de orden p . El modelo AR( p ) se escribe como
donde son parámetros y la variable aleatoria es ruido blanco , generalmente variables aleatorias normales independientes e idénticamente distribuidas (iid) . [1] [2]
Para que el modelo permanezca estacionario , las raíces de su polinomio característico deben estar fuera del círculo unitario. Por ejemplo, los procesos en el modelo AR(1) con no son estacionarios porque la raíz de se encuentra dentro del círculo unitario. [3]
La prueba aumentada de Dickey-Fuller evalúa la estabilidad de los componentes de tendencia y del FMI. Para las series temporales estacionarias, se utiliza el modelo ARMA, mientras que para las series no estacionarias, se utilizan los modelos LSTM para derivar características abstractas. El valor final se obtiene reconstruyendo los resultados previstos de cada serie temporal.
Modelo de media móvil
La notación MA( q ) se refiere al modelo de media móvil de orden q :
donde son los parámetros del modelo, es la expectativa de (que a menudo se supone que es igual a 0), y , ..., son términos de error de ruido blanco iid que comúnmente son variables aleatorias normales. [4]
Modelo ARMA
La notación ARMA( p , q ) se refiere al modelo con p términos autorregresivos y q términos de promedio móvil. Este modelo contiene los modelos AR( p ) y MA( q ), [5]
En términos del operador de rezago
En algunos textos, los modelos se especifican utilizando el operador de retardo L . En estos términos, el modelo AR( p ) se da por
donde representa el polinomio
El modelo MA( q ) está dado por
donde representa el polinomio
Finalmente, el modelo combinado ARMA( p , q ) viene dado por
o más concisamente,
o
Esta es la forma utilizada en Box , Jenkins y Reinsel. [6]
Además, si comenzamos las sumas desde y estableciendo y , obtenemos una formulación aún más elegante:
Espectro
La densidad espectral de un proceso ARMA es donde es la varianza del ruido blanco, es el polinomio característico de la parte de promedio móvil del modelo ARMA y es el polinomio característico de la parte autorregresiva del modelo ARMA. [7] [8]
Modelos de ajuste
Elecciónpagyq
Se puede encontrar un valor apropiado de p en el modelo ARMA( p , q ) al trazar las funciones de autocorrelación parcial . De manera similar, q se puede estimar utilizando las funciones de autocorrelación . Tanto p como q se pueden determinar simultáneamente utilizando funciones de autocorrelación extendidas (EACF). [9] Se puede obtener más información considerando las mismas funciones para los residuos de un modelo ajustado con una selección inicial de p y q .
Brockwell y Davis recomiendan utilizar el criterio de información de Akaike (AIC) para encontrar p y q . [10] Otra opción es el criterio de información bayesiano (BIC).
Estimación de coeficientes
Después de elegir p y q, los modelos ARMA se pueden ajustar mediante regresión de mínimos cuadrados para encontrar los valores de los parámetros que minimizan el término de error. Es una buena práctica encontrar los valores más pequeños de p y q que proporcionen un ajuste aceptable a los datos. Para un modelo AR puro, se pueden utilizar las ecuaciones de Yule-Walker para proporcionar un ajuste.
Los resultados de ARMA se utilizan principalmente para pronosticar (predecir), y no para inferir causalidad como en otras áreas de la econometría y métodos de regresión como MCO y 2SLS.
Implementaciones de software
- En R , el paquete estándar
stats
tiene la función arima
, documentada en ARIMA Modelling of Time Series. El paquete astsa tiene un script mejorado llamado sarima
para ajustar modelos ARMA (estacionales y no estacionales) y sarima.sim
para simular datos de estos modelos. Los paquetes de extensión contienen funcionalidades relacionadas y extendidas: el paquete tseries
incluye la función arma()
, documentada en "Fit ARMA Models to Time Series"; el paquete fracdiff contiene fracdiff()
para procesos ARMA integrados fraccionariamente; y el paquete forecast incluye auto.arima
para seleccionar un conjunto parsimonioso de p, q . La vista de tareas de CRAN sobre series temporales contiene enlaces a la mayoría de estos. - Mathematica tiene una biblioteca completa de funciones de series de tiempo, incluida ARMA. [11]
- MATLAB incluye funciones como arma, ar y arx para estimar modelos autorregresivos, autorregresivos exógenos y ARMAX. Consulte Caja de herramientas de identificación de sistemas y Caja de herramientas de econometría para obtener más información.
- Julia tiene paquetes impulsados por la comunidad que implementan el ajuste con un modelo ARMA como arma.jl.
- Python tiene el
statsmodels
paquete S, que incluye muchos modelos y funciones para el análisis de series temporales, incluido ARMA. Anteriormente formaba parte de la biblioteca scikit-learn , pero ahora es independiente y se integra bien con Pandas . - PyFlux tiene una implementación basada en Python de modelos ARIMAX, incluidos modelos ARIMAX bayesianos.
- Las bibliotecas numéricas IMSL son bibliotecas de funcionalidad de análisis numérico que incluyen procedimientos ARMA y ARIMA implementados en lenguajes de programación estándar como C, Java, C# .NET y Fortran.
- Gretl puede estimar modelos ARMA, como se menciona aquí
- El paquete adicional GNU Octave octave-forge admite modelos AR.
- Stata incluye la función
arima
. para los modelos ARMA y ARIMA . - SuanShu es una biblioteca Java de métodos numéricos que implementa modelos univariados/multivariados ARMA, ARIMA, ARMAX, etc., documentados en "SuanShu, una biblioteca numérica y estadística Java".
- SAS cuenta con un paquete econométrico, ETS, que permite estimar modelos ARIMA. Ver detalles.
Historia e interpretaciones
El modelo ARMA general fue descrito en la tesis de 1951 de Peter Whittle , quien utilizó el análisis matemático ( series de Laurent y análisis de Fourier ) y la inferencia estadística. [12] [13] Los modelos ARMA se popularizaron gracias a un libro de 1970 de George EP Box y Jenkins, quien expuso un método iterativo ( Box–Jenkins ) para elegirlos y estimarlos. Este método fue útil para polinomios de orden bajo (de grado tres o menos). [14]
ARMA es esencialmente un filtro de respuesta de impulso infinito aplicado al ruido blanco, al que se le agrega alguna interpretación adicional.
En el procesamiento de señales digitales , ARMA se representa como un filtro digital con ruido blanco en la entrada y el proceso ARMA en la salida.
Aplicaciones
El ARMA es apropiado cuando un sistema es una función de una serie de shocks no observados (la media móvil o parte del promedio móvil) así como de su propio comportamiento. Por ejemplo, los precios de las acciones pueden verse afectados por información fundamental y exhibir efectos de tendencia técnica y reversión a la media debido a los participantes del mercado. [ cita requerida ]
Generalizaciones
Existen varias generalizaciones de ARMA. La AR no lineal (NAR), la MA no lineal (NMA) y la ARMA no lineal (NARMA) modelan la dependencia no lineal de valores pasados y términos de error. La AR vectorial (VAR) y la ARMA vectorial (VARMA) modelan series temporales multivariadas . La media móvil autorregresiva integrada (ARIMA) modela series temporales no estacionarias (es decir, cuya media cambia con el tiempo). La heterocedasticidad condicional autorregresiva (ARCH) modela series temporales donde la varianza cambia. La ARIMA estacional (SARIMA o ARMA periódica) modela la variación periódica . La media móvil autorregresiva integrada fraccionalmente (ARFIMA, o ARIMA fraccional, FARIMA) modela series temporales que exhiben memoria larga . La AR multiescala (MAR) está indexada por los nodos de un árbol en lugar de números enteros.
Modelo autorregresivo de media móvil con entradas exógenas (ARMAX)
La notación ARMAX( p , q , b ) se refiere a un modelo con p términos autorregresivos, q términos de promedio móvil y b términos de entradas exógenas. El último término es una combinación lineal de los últimos b términos de una serie temporal conocida y externa . Viene dada por:
¿Dónde están los parámetros de la entrada exógena ?
Se han definido algunas variantes no lineales de modelos con variables exógenas: véase por ejemplo Modelo exógeno autorregresivo no lineal .
Los paquetes estadísticos implementan el modelo ARMAX mediante el uso de variables "exógenas" (es decir, independientes). Se debe tener cuidado al interpretar la salida de esos paquetes, porque los parámetros estimados generalmente (por ejemplo, en R [15] y gretl ) hacen referencia a la regresión:
donde incorpora todas las variables exógenas (o independientes):
Véase también
Referencias
- ^ Box, George EP (1994). Análisis de series temporales: pronóstico y control. Gwilym M. Jenkins, Gregory C. Reinsel (3.ª ed.). Englewood Cliffs, NJ: Prentice Hall. pág. 54. ISBN 0-13-060774-6.OCLC 28888762 .
- ^ Shumway, Robert H. (2000). Análisis de series temporales y sus aplicaciones. David S. Stoffer. Nueva York: Springer. pp. 90–91. ISBN 0-387-98950-1.OCLC 42392178 .
- ^ Box, George EP; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Análisis de series temporales: pronóstico y control (3.ª ed.). Englewood Cliffs, NJ: Prentice Hall. pp. 54–55. ISBN 0-13-060774-6.OCLC 28888762 .
- ^ Box, George EP; Jenkins, Gwilym M.; Reinsel, Gregory C.; Ljung, Greta M. (2016). Análisis de series temporales: pronóstico y control (5.ª ed.). Hoboken, Nueva Jersey: John Wiley & Sons, Incorporated. pág. 53. ISBN 978-1-118-67492-5.OCLC 908107438 .
- ^ Shumway, Robert H. (2000). Análisis de series temporales y sus aplicaciones. David S. Stoffer. Nueva York: Springer. pág. 98. ISBN 0-387-98950-1.OCLC 42392178 .
- ^ Box, George; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Análisis de series temporales: pronóstico y control (tercera edición). Prentice-Hall. ISBN 0130607746.
- ^ Rosenblatt, Murray (2000). Series temporales lineales gaussianas y no gaussianas y campos aleatorios. Nueva York: Springer. p. 10. ISBN 0-387-98917-X.OCLC 42061096 .
- ^ Wei, William WS (1990). Análisis de series temporales: métodos univariados y multivariados. Redwood City, California: Addison-Wesley Pub. págs. 242–243. ISBN 0-201-15911-2.OCLC 18166355 .
- ^ Universidad Estatal de Missouri. "Especificación del modelo, análisis de series temporales" (PDF) .
- ^ Brockwell, PJ; Davis, RA (2009). Series temporales: teoría y métodos (2ª ed.). Nueva York: Springer. pag. 273.ISBN 9781441903198.
- ^ Características de series temporales en Mathematica Archivado el 24 de noviembre de 2011 en Wayback Machine .
- ^ Hannan, Edward James (1970). Series temporales múltiples . Series de Wiley en probabilidad y estadística matemática. Nueva York: John Wiley and Sons.
- ^ Whittle, P. (1951). Pruebas de hipótesis en análisis de series temporales . Almquist y Wicksell.Whittle, P. (1963). Predicción y regulación . English Universities Press. ISBN 0-8166-1147-5.
- Republicado como: Whittle, P. (1983). Predicción y regulación mediante métodos de mínimos cuadrados lineales . University of Minnesota Press. ISBN 0-8166-1148-3.
- ^ Hannan y Deistler (1988, pág. 227): Hannan, EJ ; Deistler, Manfred (1988). Teoría estadística de sistemas lineales . Series de Wiley en probabilidad y estadística matemática. Nueva York: John Wiley and Sons.
- ^ Modelado ARIMA de series temporales, documentación R
Lectura adicional
- Mills, Terence C. (1990). Técnicas de series temporales para economistas . Cambridge University Press. ISBN 0521343399.
- Percival, Donald B.; Walden, Andrew T. (1993). Análisis espectral para aplicaciones físicas . Cambridge University Press. ISBN 052135532X.
- Francq, C.; Zakoïan, J.-M. (2005), "Resultados recientes para modelos de series de tiempo lineales con innovaciones no independientes", en Duchesne, P.; Remillard, B. (eds.), Modelado estadístico y análisis para problemas de datos complejos , Springer, págs. 241–265, CiteSeerX 10.1.1.721.1754.
- Shumway, RH y Stoffer, DS (2017). Análisis de series temporales y sus aplicaciones con ejemplos de R. Springer. DOI: 10.1007/978-3-319-52452-8