stringtranslate.com

Media móvil integrada autorregresiva

En estadística y econometría , y en particular en análisis de series de tiempo , un modelo de media móvil autorregresiva integrada ( ARIMA ) es una generalización de un modelo de media móvil autorregresiva (ARMA). Para comprender mejor los datos o pronosticar los próximos puntos de la serie, ambos modelos se ajustan a datos de series temporales . Los modelos ARIMA se aplican en algunos casos donde los datos muestran evidencia de no estacionariedad en el sentido de media (pero no varianza/ autocovarianza ), donde se puede aplicar un paso de diferenciación inicial (correspondiente a la parte "integrada" del modelo) uno o más veces para eliminar la no estacionariedad de la función media (es decir, la tendencia). [1] Cuando la estacionalidad se muestra en una serie de tiempo, se podría aplicar la diferenciación estacional [2] para eliminar el componente estacional. Dado que el modelo ARMA , según el teorema de descomposición de Wold, [3] [4] [5] es teóricamente suficiente para describir una serie de tiempo estacionaria de sentido amplio regular (también conocida como puramente no determinista [5] ) , estamos motivados a hacer estacionaria una series de tiempo no estacionarias, por ejemplo, mediante el uso de diferenciación, antes de que podamos usar el modelo ARMA . [6] Tenga en cuenta que si la serie temporal contiene un subproceso predecible (también conocido como seno puro o proceso exponencial de valores complejos [4] ), el componente predecible se trata como un componente periódico (es decir, estacional) no de media nula en el marco ARIMA para que sea eliminado por la diferenciación estacional.

La parte autorregresiva ( AR ) de ARIMA indica que la variable evolutiva de interés retrocede en sus propios valores rezagados (es decir, anteriores). La parte del promedio móvil ( MA ) indica que el error de regresión es en realidad una combinación lineal de términos de error cuyos valores ocurrieron simultáneamente y en varios momentos del pasado. [7] La ​​I (de "integrado") indica que los valores de los datos han sido reemplazados con la diferencia entre sus valores y los valores anteriores (y este proceso de diferenciación puede haberse realizado más de una vez). El propósito de cada una de estas características es hacer que el modelo se ajuste a los datos lo mejor posible.

Los modelos ARIMA no estacionales generalmente se denominan ARIMA ( p , d , q ) donde los parámetros p , d y q son números enteros no negativos, p es el orden (número de desfases de tiempo) del modelo autorregresivo , d es el grado de diferenciación (el número de veces que a los datos se les han restado valores anteriores) y q es el orden del modelo de media móvil . Los modelos ARIMA estacionales generalmente se denotan ARIMA( p , d , q )( P , D , Q ) m , donde m se refiere al número de períodos en cada temporada, y las mayúsculas P , D , Q se refieren a la diferenciación autorregresiva, y términos de media móvil para la parte estacional del modelo ARIMA. [8] [2]

Cuando dos de los tres términos son ceros, se puede hacer referencia al modelo basándose en el parámetro distinto de cero, eliminando " AR ", " I " o " MA " del acrónimo que describe el modelo. Por ejemplo, es AR(1) , es I(1) y es MA(1) .

Los modelos ARIMA se pueden estimar siguiendo el enfoque de Box-Jenkins .

Definición

Dada la serie de datos de tiempo X t donde t es un índice entero y los X t son números reales, un modelo viene dado por

o equivalente por

donde es el operador de retraso , son los parámetros de la parte autorregresiva del modelo, son los parámetros de la parte de media móvil y son los términos de error. Generalmente se supone que los términos de error son variables independientes, distribuidas idénticamente, muestreadas a partir de una distribución normal con media cero.

Supongamos ahora que el polinomio tiene una raíz unitaria (un factor ) de multiplicidad d . Entonces se puede reescribir como:

Un proceso ARIMA( p , d , q ) expresa esta propiedad de factorización polinomial con p = p'−d y viene dado por:

y por lo tanto puede considerarse como un caso particular de un proceso ARMA( p+d , q ) que tiene el polinomio autorregresivo con d raíces unitarias. (Por esta razón, ningún proceso descrito con precisión mediante un modelo ARIMA con d  > 0 es estacionario en sentido amplio ).

Lo anterior se puede generalizar de la siguiente manera.

Esto define un proceso ARIMA( p , d , q ) con deriva .

Otras formas especiales

La identificación explícita de la factorización del polinomio de autorregresión en factores como se indicó anteriormente se puede extender a otros casos, en primer lugar para aplicarla al polinomio de media móvil y, en segundo lugar, para incluir otros factores especiales. Por ejemplo, tener un factor en un modelo es una forma de incluir una estacionalidad no estacionaria del período s en el modelo; este factor tiene el efecto de reexpresar los datos como cambios desde hace s períodos. Otro ejemplo es el factor , que incluye una estacionalidad (no estacionaria) del período 2. [ se necesita aclaración ] El efecto del primer tipo de factor es permitir que el valor de cada estación varíe por separado a lo largo del tiempo, mientras que con el segundo tipo los valores para las estaciones adyacentes se mueven juntas. [ se necesita aclaración ]

La identificación y especificación de factores apropiados en un modelo ARIMA puede ser un paso importante en la modelización, ya que puede permitir una reducción en el número total de parámetros a estimar y al mismo tiempo permitir la imposición en el modelo de tipos de comportamiento que la lógica y la experiencia sugieren que deberían ser allá.

diferenciación

Las propiedades de una serie temporal estacionaria no dependen del momento en el que se observa la serie. Específicamente, para una serie temporal estacionaria de sentido amplio , la media y la varianza/ autocovarianza se mantienen constantes a lo largo del tiempo. La diferenciación en estadística es una transformación aplicada a una serie temporal no estacionaria para volverla estacionaria en el sentido medio (es decir, para eliminar la tendencia no constante), pero que no tiene nada que ver con la no estacionariedad de la serie temporal. varianza o autocovarianza . Asimismo, la diferenciación estacional se aplica a una serie temporal estacional para eliminar el componente estacional. Desde la perspectiva del procesamiento de señales, especialmente la teoría del análisis espectral de Fourier , la tendencia es la parte de baja frecuencia en el espectro de una serie temporal no estacionaria, mientras que la estación es la parte de frecuencia periódica en el espectro de la misma. Por lo tanto, la diferenciación funciona como un filtro de paso alto (es decir, de parada baja) y la diferenciación estacional como un filtro de peine para suprimir la tendencia de baja frecuencia y la temporada de frecuencia periódica en el dominio del espectro (en lugar de directamente en el dominio del espectro). dominio del tiempo), respectivamente. [6]

Para diferenciar los datos, se calcula la diferencia entre observaciones consecutivas. Matemáticamente, esto se muestra como

La diferenciación elimina los cambios en el nivel de una serie temporal, eliminando la tendencia y la estacionalidad y, en consecuencia, estabilizando la media de la serie temporal. [6]

A veces puede ser necesario diferenciar los datos una segunda vez para obtener una serie temporal estacionaria, lo que se conoce como diferenciación de segundo orden :

Otro método para diferenciar datos es la diferenciación estacional, que implica calcular la diferencia entre una observación y la observación correspondiente en la temporada anterior, por ejemplo, un año. Esto se muestra como:

Luego, los datos diferenciados se utilizan para la estimación de un modelo ARMA .

Ejemplos

Algunos casos especiales bien conocidos surgen de forma natural o son matemáticamente equivalentes a otros modelos de pronóstico populares. Por ejemplo:

Elegir el orden

El orden p y q se pueden determinar utilizando la función de autocorrelación de muestra (ACF), la función de autocorrelación parcial (PACF) y/o el método de función de autocorrelación extendida (EACF). [10]

Otros métodos alternativos incluyen AIC, BIC, etc. [10] Para determinar el orden de un modelo ARIMA no estacional, un criterio útil es el criterio de información de Akaike (AIC) . Esta escrito como

donde L es la probabilidad de los datos, p es el orden de la parte autorregresiva y q es el orden de la parte de media móvil. La k representa la intersección del modelo ARIMA. Para AIC, si k = 1 entonces hay una intersección en el modelo ARIMA ( c ≠ 0) y si k = 0 entonces no hay una intersección en el modelo ARIMA ( c = 0).

El AIC corregido para los modelos ARIMA se puede escribir como

El criterio de información bayesiano (BIC) se puede escribir como

El objetivo es minimizar los valores AIC, AICc o BIC para un buen modelo. Cuanto menor sea el valor de uno de estos criterios para una variedad de modelos que se investigan, mejor se adaptará el modelo a los datos. El AIC y el BIC se utilizan para dos fines completamente diferentes. Mientras que el AIC intenta aproximar los modelos a la realidad de la situación, el BIC intenta encontrar el ajuste perfecto. El enfoque BIC es a menudo criticado porque nunca se adapta perfectamente a los datos complejos de la vida real; sin embargo, sigue siendo un método útil de selección, ya que penaliza más a los modelos por tener más parámetros de los que tendría el AIC.

AICc solo se puede utilizar para comparar modelos ARIMA con los mismos órdenes de diferenciación. Para ARIMA con diferentes órdenes de diferenciación, se puede utilizar RMSE para comparar modelos.

Estimación de coeficientes

Pronósticos utilizando modelos ARIMA

El modelo ARIMA puede verse como una "cascada" de dos modelos. El primero no es estacionario:

mientras que el segundo es estacionario de sentido amplio :

Ahora se pueden hacer pronósticos para el proceso , utilizando una generalización del método de pronóstico autorregresivo .

Intervalos de pronóstico

Los intervalos de pronóstico ( intervalos de confianza para pronósticos) para los modelos ARIMA se basan en suposiciones de que los residuos no están correlacionados y se distribuyen normalmente. Si alguno de estos supuestos no se cumple, entonces los intervalos de pronóstico pueden ser incorrectos. Por esta razón, los investigadores trazan el ACF y el histograma de los residuos para verificar los supuestos antes de producir intervalos de pronóstico.

Intervalo de pronóstico del 95%: , donde es la varianza de .

Para , para todos los modelos ARIMA independientemente de parámetros y pedidos.

Para ARIMA(0,0,q),

[ cita necesaria ]

En general, los intervalos de pronóstico de los modelos ARIMA aumentarán a medida que aumente el horizonte de pronóstico.

Variaciones y extensiones

Comúnmente se emplean varias variaciones del modelo ARIMA. Si se utilizan varias series de tiempo, se pueden considerar vectores y un modelo VARIMA puede ser apropiado. A veces se sospecha un efecto estacional en el modelo; en ese caso, generalmente se considera mejor utilizar un modelo SARIMA (ARIMA estacional) que aumentar el orden de las partes AR o MA del modelo. [11] Si se sospecha que la serie temporal exhibe una dependencia de largo alcance , entonces se puede permitir que el parámetro d tenga valores no enteros en un modelo de promedio móvil autorregresivo fraccionalmente integrado , que también se denomina ARIMA fraccional (FARIMA o ARFIMA). ) modelo.

Implementaciones de software

Se encuentran disponibles varios paquetes que aplican metodología como la optimización de parámetros Box-Jenkins para encontrar los parámetros correctos para el modelo ARIMA.

See also

References

  1. ^ For further information on Stationarity and Differencing see https://www.otexts.org/fpp/8/1
  2. ^ ab Hyndman, Rob J; Atanasopoulos, George. 8.9 Modelos ARIMA estacionales. o Textos . Consultado el 19 de mayo de 2015 . {{cite book}}: |website=ignorado ( ayuda )
  3. ^ Hamilton, James (1994). Análisis de series temporales . Prensa de la Universidad de Princeton. ISBN 9780691042893.
  4. ^ ab Papoulis, Atanasios (2002). Probabilidad, variables aleatorias y procesos estocásticos . Educación de Tata McGraw-Hill.
  5. ^ ab Triacca, Umberto (19 de febrero de 2021). "El teorema de la descomposición de Wold" (PDF) . Archivado (PDF) desde el original el 27 de marzo de 2016.
  6. ^ abc Wang, Shixiong; Li, Chongshou; Lim, Andrés (18 de diciembre de 2019). "¿Por qué ARIMA y SARIMA no son suficientes?". arXiv : 1904.07632 [estad.AP].
  7. ^ Caja, George EP (2015). Análisis de series temporales: previsión y control . WILEY. ISBN 978-1-118-67502-1.
  8. ^ "Notación para modelos ARIMA". Sistema de pronóstico de series temporales . Instituto SAS . Consultado el 19 de mayo de 2015 .
  9. ^ ab "Introducción a los modelos ARIMA". gente.duke.edu . Consultado el 5 de junio de 2016 .
  10. ^ ab Universidad Estatal de Missouri. "Especificación del modelo, análisis de series temporales" (PDF) .
  11. ^ Swain, S; et al. (2018). "Desarrollo de un modelo ARIMA para la previsión mensual de precipitaciones en el distrito de Khordha, Odisha, India". Hallazgos recientes en técnicas de computación inteligente . Avances en Sistemas Inteligentes y Computación. vol. 708, págs. 325–331). doi :10.1007/978-981-10-8636-6_34. ISBN 978-981-10-8635-9. {{cite book}}: |journal=ignorado ( ayuda )
  12. ^ TimeModels.jl www.github.com
  13. ^ ARIMA en NCSS,
  14. ^ ARMA automático en NCSS,
  15. ^ Autocorrelaciones y autocorrelaciones parciales en NCSS
  16. ^ 8.7 Modelado ARIMA en R | OTextos . Consultado el 12 de mayo de 2016 . {{cite book}}: |website=ignorado ( ayuda )
  17. ^ "Modelo de caja Jenkins". SAP . Consultado el 8 de marzo de 2013 .

Otras lecturas

enlaces externos