Modelo estadístico utilizado en el análisis de series de tiempo.
En el análisis estadístico de series de tiempo , los modelos de media móvil autorregresiva ( ARMA ) proporcionan una descripción parsimoniosa de un proceso estocástico (débilmente) estacionario en términos de dos polinomios, uno para la autorregresión (AR) y el segundo para la media móvil ( MAMÁ). El modelo ARMA general se describió en la tesis de 1951 de Peter Whittle , Pruebas de hipótesis en análisis de series temporales , y se popularizó en el libro de 1970 de George EP Box y Gwilym Jenkins .
Dada una serie temporal de datos , el modelo ARMA es una herramienta para comprender y, quizás, predecir valores futuros en esta serie. La parte AR implica hacer una regresión de la variable en sus propios valores rezagados (es decir, pasados). La parte MA implica modelar el término de error como una combinación lineal de términos de error que ocurren contemporáneamente y en varios momentos del pasado. El modelo generalmente se denomina modelo ARMA ( p , q ), donde p es el orden de la parte AR y q es el orden de la parte MA (como se define a continuación).![{\displaystyle X_{t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Los modelos ARMA se pueden estimar utilizando el método de Box-Jenkins .
Modelo autorregresivo
La notación AR( p ) se refiere al modelo autorregresivo de orden p . El modelo AR( p ) se escribe como
![{\displaystyle X_{t}=\sum _{i=1}^{p}\varphi _{i}X_{ti}+\varepsilon _{t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
donde son los parámetros y la variable aleatoria es el ruido blanco , generalmente variables aleatorias normales independientes e idénticamente distribuidas (iid) . [1] [2]![{\displaystyle \varphi _{1},\ldots ,\varphi _{p}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varepsilon _ {t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Para que el modelo permanezca estacionario , las raíces de su polinomio característico deben estar fuera del círculo unitario. Por ejemplo, los procesos en el modelo AR(1) no son estacionarios porque la raíz de se encuentra dentro del círculo unitario. [3]![{\displaystyle |\varphi _ {1}|\geq 1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle 1-\varphi _{1}B=0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
ADF evalúa la estabilidad del FMI y los componentes de tendencia. Para series temporales estacionarias, se utiliza el modelo de media móvil autorregresiva (ARMA), mientras que para series no estacionarias, se emplean modelos LSTM para derivar características abstractas. El valor final se obtiene reconstruyendo los resultados previstos de cada serie temporal.
Modelo de media móvil
La notación MA( q ) se refiere al modelo de media móvil de orden q :
![{\displaystyle X_{t}=\mu +\varepsilon _ {t}+\sum _ {i=1}^{q}\theta _ {i}\varepsilon _ {ti}\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
donde son los parámetros del modelo, es la expectativa de (a menudo se supone que es igual a 0) y , ,... son nuevamente términos de error de ruido blanco iid que comúnmente son variables aleatorias normales. [4]![{\displaystyle \theta _ {1},...,\theta _ {q}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mu}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle X_{t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varepsilon _ {t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varepsilon _ {t-1}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
modelo ARMA
La notación ARMA( p , q ) se refiere al modelo con p términos autorregresivos y q términos de media móvil. Este modelo contiene los modelos AR( p ) y MA( q ), [5]
![{\displaystyle X_{t}=\varepsilon _{t}+\sum _{i=1}^{p}\varphi _{i}X_{ti}+\sum _{i=1}^{q} \theta _{i}\varepsilon _{ti}.\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
El modelo ARMA general fue descrito en la tesis de 1951 de Peter Whittle , quien utilizó análisis matemático ( series de Laurent y análisis de Fourier ) e inferencia estadística. [6] [7] Los modelos ARMA fueron popularizados por un libro de 1970 de George EP Box y Jenkins, quienes expusieron un método iterativo ( Box-Jenkins ) para elegirlos y estimarlos. Este método fue útil para polinomios de bajo orden (de grado tres o menos). [8]
El modelo ARMA es esencialmente un filtro de respuesta de impulso infinito aplicado al ruido blanco, con alguna interpretación adicional.
Especificación en términos de operador de retraso
En algunos textos los modelos se especificarán en términos del operador de retraso L. En estos términos, entonces el modelo AR( p ) viene dado por
![{\displaystyle \varepsilon _ {t}=\left(1-\sum _ {i=1}^{p}\varphi _ {i}L^{i}\right)X_ {t}=\varphi (L )X_{t}\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
donde representa el polinomio![{\displaystyle \varphi}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varphi (L)=1-\sum _{i=1}^{p}\varphi _{i}L^{i}.\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
El modelo MA( q ) viene dado por
![{\displaystyle X_{t}-\mu =\left(1+\sum _{i=1}^{q}\theta _{i}L^{i}\right)\varepsilon _{t}=\ theta (L)\varepsilon _ {t},\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
donde representa el polinomio![{\displaystyle \theta}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \theta (L)=1+\sum _{i=1}^{q}\theta _{i}L^{i}.\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Finalmente, el modelo ARMA combinado ( p , q ) viene dado por
![{\displaystyle \left(1-\sum _{i=1}^{p}\varphi _{i}L^{i}\right)X_{t}=\left(1+\sum _{i= 1}^{q}\theta _ {i}L^{i}\right)\varepsilon _ {t}\,,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
o más concisamente,
![{\displaystyle \varphi (L)X_ {t}=\theta (L)\varepsilon _ {t}\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
o
![{\displaystyle {\frac {\varphi (L)}{\theta (L)}}X_ {t}=\varepsilon _ {t}\,.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Notación alternativa
Algunos autores, incluidos Box , Jenkins y Reinsel, utilizan una convención diferente para los coeficientes de autorregresión. [9] Esto permite que todos los polinomios que involucran al operador de retraso aparezcan en una forma similar en todo momento. Por tanto, el modelo ARMA se escribiría como
![{\displaystyle \left(1-\sum _{i=1}^{p}\phi _{i}L^{i}\right)X_{t}=\left(1+\sum _{i=) 1}^{q}\theta _ {i}L^{i}\right)\varepsilon _ {t}\,.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Además, comenzando las sumas desde y estableciendo y , obtenemos una formulación aún más elegante:![{\displaystyle i=0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \phi _{0}=-1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \theta _ {0}=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle -\sum _{i=0}^{p}\phi _{i}L^{i}\;X_{t}=\sum _{i=0}^{q}\theta _ i}L^{i}\;\varepsilon _ {t}\,.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Interpretación alternativa
En el procesamiento de señales digitales , el modelo ARMA se representa como un filtro digital con ruido blanco en la entrada y el proceso ARMA en la salida.
Modelos apropiados
Eligiendo p y q
Se puede facilitar la búsqueda de valores apropiados de pyq en el modelo ARMA( p , q ) trazando las funciones de autocorrelación parcial para una estimación de p y, de la misma manera, utilizando las funciones de autocorrelación para una estimación de q . Las funciones de autocorrelación extendida (EACF) se pueden utilizar para determinar simultáneamente p y q. [10] Se puede obtener más información considerando las mismas funciones para los residuos de un modelo equipado con una selección inicial de p y q .
Brockwell y Davis recomiendan utilizar el criterio de información de Akaike (AIC) para encontrar p y q . [11] Otra posible opción para determinar el orden es el criterio BIC .
Estimación de coeficientes
Los modelos ARMA en general pueden, después de elegir p y q , ajustarse mediante regresión de mínimos cuadrados para encontrar los valores de los parámetros que minimizan el término de error. Generalmente se considera una buena práctica encontrar los valores más pequeños de p y q que proporcionen un ajuste aceptable a los datos. Para un modelo AR puro, se pueden utilizar las ecuaciones de Yule-Walker para proporcionar un ajuste.
A diferencia de otros métodos de regresión (es decir, MCO, 2SLS, etc.) que se emplean a menudo en el análisis econométrico, los resultados del modelo ARMA se utilizan principalmente para los casos de pronóstico de datos de series de tiempo. Entonces, sus coeficientes como tales sólo se utilizan para la predicción. Otras áreas de la econometría analizan la inferencia causal, mientras que el pronóstico de series de tiempo utilizando ARMA no. Por tanto, los coeficientes sólo deberían considerarse útiles para la elaboración de modelos predictivos.
Implementaciones en paquetes estadísticos.
- En R , la función arima (en el paquete estándar stats ) está documentada en ARIMA Modelado de series temporales. El paquete astsa tiene un script mejorado llamado sarima para ajustar modelos ARMA (estacionales y no estacionales), así como sarima.sim para simular datos de estos modelos. Los paquetes de extensión contienen funcionalidades relacionadas y extendidas, por ejemplo, el paquete tseries incluye una función arma , documentada en "Ajustar modelos ARMA a series temporales"; el paquete fracdiff contiene fracdiff() para procesos ARMA fraccionariamente integrados; y el paquete de pronóstico incluye auto.arima para seleccionar un conjunto parsimonioso de p,q . La vista de tareas CRAN en Series temporales contiene enlaces a la mayoría de ellas.
- Mathematica tiene una biblioteca completa de funciones de series temporales que incluye ARMA. [12]
- MATLAB incluye funciones como arma, ar y arx para estimar modelos AR, ARX (exógeno autorregresivo) y ARMAX. Consulte Caja de herramientas de identificación del sistema y Caja de herramientas de econometría para obtener más información.
- Julia tiene algunos paquetes impulsados por la comunidad que implementan el ajuste con un modelo ARMA como arma.jl.
- El módulo Python de Statsmodels incluye muchos modelos y funciones para el análisis de series de tiempo, incluido ARMA. Anteriormente formaba parte de la biblioteca scikit-learn , ahora es independiente y se integra bien con Pandas . Consulte aquí para obtener más detalles.
- PyFlux tiene una implementación basada en Python de los modelos ARIMAX, incluidos los modelos bayesianos ARIMAX.
- Las bibliotecas numéricas IMSL son bibliotecas de funcionalidad de análisis numérico que incluyen procedimientos ARMA y ARIMA implementados en lenguajes de programación estándar como C, Java, C# .NET y Fortran.
- gretl también puede estimar el modelo ARMA, consulte aquí donde se menciona.
- GNU Octave puede estimar modelos AR utilizando funciones del paquete adicional octave-forge.
- Stata incluye la función arima que puede estimar los modelos ARMA y ARIMA . Consulte aquí para obtener más detalles.
- SuanShu es una biblioteca Java de métodos numéricos, que incluye paquetes estadísticos integrales, en los que se implementan modelos univariados/multivariados ARMA, ARIMA, ARMAX, etc. en un enfoque orientado a objetos. Estas implementaciones están documentadas en "SuanShu, una biblioteca numérica y estadística de Java".
- SAS dispone de un paquete econométrico, ETS, que estima modelos ARIMA. Consulte aquí para obtener más detalles.
Espectro
La densidad espectral de un proceso ARMA es
![{\displaystyle S(f)={\frac {\sigma ^{2}}{2\pi }}\left\vert {\frac {\theta (e^{-if})}{\phi (e^ {-if})}}\right\vert ^{2}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
varianza[13] [14]![{\displaystyle \sigma ^{2}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \theta}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \phi}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Aplicaciones
ARMA es apropiado cuando un sistema es función de una serie de shocks no observados (el MA o parte de media móvil), así como de su propio comportamiento. Por ejemplo, los precios de las acciones pueden verse afectados por la información fundamental, además de mostrar tendencias técnicas y efectos de reversión a la media debidos a los participantes del mercado. [ cita necesaria ]
Generalizaciones
Se supone que la dependencia de valores pasados y los términos de error ε t es lineal a menos que se especifique lo contrario. Si la dependencia es no lineal, el modelo se denomina específicamente modelo de media móvil no lineal (NMA), autorregresivo no lineal (NAR) o modelo de media móvil autorregresiva no lineal (NARMA).![{\displaystyle X_{t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Los modelos autorregresivos de media móvil se pueden generalizar de otras maneras. Véanse también los modelos autorregresivos de heterocedasticidad condicional (ARCH) y los modelos autorregresivos de media móvil integrada (ARIMA). Si se van a ajustar varias series temporales, se puede ajustar un modelo vectorial ARIMA (o VARIMA). Si la serie temporal en cuestión exhibe una memoria larga, entonces el modelado ARIMA fraccional (FARIMA, a veces llamado ARFIMA) puede ser apropiado: consulte Media móvil autorregresiva fraccionariamente integrada . Si se cree que los datos contienen efectos estacionales, se pueden modelar mediante un modelo SARIMA (ARIMA estacional) o un modelo ARMA periódico.
Otra generalización es el modelo autorregresivo multiescala (MAR). Un modelo MAR está indexado por los nodos de un árbol, mientras que un modelo autorregresivo estándar (tiempo discreto) está indexado por números enteros.
Tenga en cuenta que el modelo ARMA es un modelo univariado . Las extensiones para el caso multivariado son la autorregresión vectorial (VAR) y la media móvil de autorregresión vectorial (VARMA).
Modelo autorregresivo de media móvil con modelo de entradas exógenas (modelo ARMAX)
La notación ARMAX( p , q , b ) se refiere al modelo con p términos autorregresivos, q términos de media móvil yb términos de entradas exógenas. Este modelo contiene los modelos AR( p ) y MA( q ) y una combinación lineal de los últimos b términos de una serie temporal conocida y externa . Está dado por:![{\displaystyle d_{t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle X_{t}=\varepsilon _{t}+\sum _{i=1}^{p}\varphi _{i}X_{ti}+\sum _{i=1}^{q} \theta _{i}\varepsilon _{ti}+\sum _{i=1}^{b}\eta _{i}d_{ti}.\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
¿Dónde están los parámetros de la entrada exógena ?![{\displaystyle \eta _{1},\ldots ,\eta _{b}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle d_{t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Se han definido algunas variantes no lineales de modelos con variables exógenas: véase por ejemplo Modelo exógeno autorregresivo no lineal .
Los paquetes estadísticos implementan el modelo ARMAX mediante el uso de variables "exógenas" (es decir, independientes). Se debe tener cuidado al interpretar la salida de esos paquetes, porque los parámetros estimados generalmente (por ejemplo, en R [15] y gretl ) se refieren a la regresión:
![{\displaystyle X_{t}-m_{t}=\varepsilon _{t}+\sum _{i=1}^{p}\varphi _{i}(X_{ti}-m_{ti})+ \sum _{i=1}^{q}\theta _{i}\varepsilon _{ti}.\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
donde incorpora todas las variables exógenas (o independientes):![{\ Displaystyle m_ {t}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle m_{t}=c+\sum _{i=0}^{b}\eta _{i}d_{ti}.\,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Ver también
Referencias
- ^ Caja, George EP (1994). Análisis de series temporales: previsión y control. Gwilym M. Jenkins, Gregory C. Reinsel (3ª ed.). Englewood Cliffs, Nueva Jersey: Prentice Hall. pag. 54.ISBN 0-13-060774-6. OCLC 28888762.
- ^ Shumway, Robert H. (2000). Análisis de series temporales y sus aplicaciones. David S. Stoffer. Nueva York: Springer. págs. 90–91. ISBN 0-387-98950-1. OCLC 42392178.
- ^ Caja, George EP; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Análisis de series de tiempo: previsión y control (3ª ed.). Englewood Cliffs, Nueva Jersey: Prentice Hall. págs. 54–55. ISBN 0-13-060774-6. OCLC 28888762.
- ^ Caja, George EP; Jenkins, Gwilym M.; Reinsel, Gregorio C.; Ljung, Greta M. (2016). Análisis de series de tiempo: previsión y control (5ª ed.). Hoboken, Nueva Jersey: John Wiley & Sons, Incorporated. pag. 53.ISBN 978-1-118-67492-5. OCLC 908107438.
- ^ Shumway, Robert H. (2000). Análisis de series temporales y sus aplicaciones. David S. Stoffer. Nueva York: Springer. pag. 98.ISBN 0-387-98950-1. OCLC 42392178.
- ^ Hannan, Edward James (1970). Múltiples series temporales . Series de Wiley en probabilidad y estadística matemática. Nueva York: John Wiley and Sons.
- ^ Whittle, P. (1951). Prueba de hipótesis en análisis de series temporales . Almquist y Wicksell.Whittle, P. (1963). Predicción y Regulación . Prensa de universidades inglesas. ISBN 0-8166-1147-5.
- Publicado nuevamente como: Whittle, P. (1983). Predicción y regulación mediante métodos lineales de mínimos cuadrados . Prensa de la Universidad de Minnesota. ISBN 0-8166-1148-3.
- ^ Hannan y Deistler (1988, pág. 227): Hannan, EJ ; Deistler, Manfred (1988). Teoría estadística de sistemas lineales . Series de Wiley en probabilidad y estadística matemática. Nueva York: John Wiley and Sons.
- ^ Caja, George; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Análisis de series temporales: previsión y control (tercera ed.). Prentice Hall. ISBN 0130607746.
- ^ Universidad Estatal de Missouri. "Especificación del modelo, análisis de series temporales" (PDF) .
- ^ Brockwell, PJ; Davis, RA (2009). Series temporales: teoría y métodos (2ª ed.). Nueva York: Springer. pag. 273.ISBN 9781441903198.
- ^ Funciones de series temporales en Mathematica Archivado el 24 de noviembre de 2011 en Wayback Machine .
- ^ Rosenblatt, Murray (2000). Series temporales lineales gaussianas y no gaussianas y campos aleatorios. Nueva York: Springer. pag. 10.ISBN 0-387-98917-X. OCLC 42061096.
- ^ Wei, William WS (1990). Análisis de series temporales: métodos univariados y multivariados. Redwood City, California: Pub Addison-Wesley. págs. 242-243. ISBN 0-201-15911-2. OCLC 18166355.
- ^ Modelado ARIMA de series temporales, documentación de R
Otras lecturas
- Molinos, Terence C. (1990). Técnicas de series temporales para economistas . Prensa de la Universidad de Cambridge. ISBN 0521343399.
- Percival, Donald B.; Walden, Andrew T. (1993). Análisis espectral para aplicaciones físicas . Prensa de la Universidad de Cambridge. ISBN 052135532X.
- Francq, C.; Zakoïan, J.-M. (2005), "Resultados recientes para modelos de series temporales lineales con innovaciones no independientes", en Duchesne, P.; Remillard, B. (eds.), Modelado y análisis estadístico para problemas de datos complejos , Springer, págs. 241–265, CiteSeerX 10.1.1.721.1754.
- Shumway, RH y Stoffer, DS (2017). Análisis de series temporales y sus aplicaciones con ejemplos de R. Saltador. DOI: 10.1007/978-3-319-52452-8