stringtranslate.com

Método de Box-Jenkins

En el análisis de series de tiempo , el método Box-Jenkins , [1] llamado así por los estadísticos George Box y Gwilym Jenkins , aplica modelos de promedio móvil autorregresivo (ARMA) o promedio móvil autorregresivo integrado (ARIMA) para encontrar el mejor ajuste de un modelo de serie de tiempo a los valores pasados ​​de una serie de tiempo .

Enfoque de modelado

El modelo original utiliza un enfoque de modelado iterativo de tres etapas:

  1. Identificación y selección de modelos : asegurarse de que las variables sean estacionarias , identificar la estacionalidad en las series dependientes (diferenciarlas estacionalmente si es necesario) y utilizar gráficos de las funciones de autocorrelación (ACF) y autocorrelación parcial (PACF) de las series de tiempo dependientes para decidir qué componente autorregresivo o de promedio móvil (si hay alguno) se debe utilizar en el modelo.
  2. Estimación de parámetros mediante algoritmos computacionales para llegar a los coeficientes que mejor se ajusten al modelo ARIMA seleccionado. Los métodos más comunes utilizan la estimación de máxima verosimilitud o la estimación de mínimos cuadrados no lineales .
  3. Comprobación estadística del modelo mediante la prueba de si el modelo estimado se ajusta a las especificaciones de un proceso univariado estacionario. En particular, los residuos deben ser independientes entre sí y constantes en media y varianza a lo largo del tiempo. (Gráficar la media y la varianza de los residuos a lo largo del tiempo y realizar una prueba de Ljung-Box o graficar la autocorrelación y la autocorrelación parcial de los residuos es útil para identificar especificaciones incorrectas). Si la estimación es inadecuada, tenemos que volver al paso uno e intentar construir un modelo mejor.

Los datos que utilizaron procedían de un horno de gas. Estos datos son conocidos como los datos de horno de gas de Box y Jenkins para la evaluación comparativa de modelos predictivos.

Commandeur y Koopman (2007, §10.4) [2] sostienen que el enfoque de Box-Jenkins es fundamentalmente problemático. El problema surge porque en "los campos económico y social, las series reales nunca son estacionarias por más que se las diferencie". Por lo tanto, el investigador tiene que enfrentarse a la pregunta: ¿cuánto es suficiente estar cerca de la estacionariedad? Como señalan los autores, "es una pregunta difícil de responder". Los autores sostienen además que, en lugar de utilizar Box-Jenkins, es mejor utilizar métodos de espacio de estados, ya que entonces no se requiere la estacionariedad de la serie temporal.

Identificación del modelo Box-Jenkins

Estacionariedad y estacionalidad

El primer paso para desarrollar un modelo Box-Jenkins es determinar si la serie temporal es estacionaria y si existe alguna estacionalidad significativa que deba modelarse.

Detección de estacionariedad

La estacionariedad se puede evaluar a partir de un gráfico de secuencia de ejecución . El gráfico de secuencia de ejecución debe mostrar una ubicación y una escala constantes . También se puede detectar a partir de un gráfico de autocorrelación . En concreto, la no estacionariedad suele indicarse mediante un gráfico de autocorrelación con una disminución muy lenta. También se puede utilizar una prueba de Dickey-Fuller o una prueba de Dickey-Fuller aumentada .

Detección de estacionalidad

La estacionalidad (o periodicidad) generalmente se puede evaluar a partir de un gráfico de autocorrelación, un gráfico de subseries estacionales o un gráfico espectral .

Diferenciación para lograr estacionariedad

Box y Jenkins recomiendan el método de diferenciación para lograr la estacionariedad. Sin embargo, en el contexto de los modelos de Box-Jenkins también se puede utilizar el método de ajuste de una curva y la resta de los valores ajustados de los datos originales.

Diferenciación estacional

En la etapa de identificación del modelo, el objetivo es detectar la estacionalidad, si existe, e identificar el orden de los términos autorregresivos estacionales y de promedio móvil estacional. Para muchas series, el período es conocido y un solo término de estacionalidad es suficiente. Por ejemplo, para los datos mensuales, normalmente se incluiría un término AR 12 estacional o un término MA 12 estacional. Para los modelos Box-Jenkins, no se elimina explícitamente la estacionalidad antes de ajustar el modelo. En cambio, se incluye el orden de los términos estacionales en la especificación del modelo para el software de estimación ARIMA . Sin embargo, puede ser útil aplicar una diferencia estacional a los datos y regenerar los gráficos de autocorrelación y autocorrelación parcial. Esto puede ayudar en la identificación del componente no estacional del modelo. En algunos casos, la diferenciación estacional puede eliminar la mayor parte o la totalidad del efecto de la estacionalidad.

Identificarpagyq

Una vez que se han abordado la estacionariedad y la estacionalidad, el siguiente paso es identificar el orden (es decir, p y q ) de los términos autorregresivos y de promedio móvil. Diferentes autores tienen diferentes enfoques para identificar p y q . Brockwell y Davis (1991) [3] afirman que "nuestro criterio principal para la selección de modelos [entre los modelos ARMA(p,q)] será el AICc", es decir, el criterio de información de Akaike con corrección. Otros autores utilizan el gráfico de autocorrelación y el gráfico de autocorrelación parcial, que se describen a continuación.

Gráficos de autocorrelación y autocorrelación parcial

Se comparan el gráfico de autocorrelación de muestra y el gráfico de autocorrelación parcial de muestra con el comportamiento teórico de estos gráficos cuando se conoce el orden.

En concreto, para un proceso AR(1) , la función de autocorrelación de la muestra debería tener una apariencia exponencialmente decreciente. Sin embargo, los procesos AR de orden superior suelen ser una mezcla de componentes sinusoidales amortiguados y exponencialmente decrecientes.

En el caso de procesos autorregresivos de orden superior, la autocorrelación de la muestra debe complementarse con un gráfico de autocorrelación parcial. La autocorrelación parcial de un proceso AR( p ) se vuelve cero en un retardo p  + 1 y mayor, por lo que examinamos la función de autocorrelación parcial de la muestra para ver si hay evidencia de una desviación de cero. Esto generalmente se determina colocando un intervalo de confianza del 95 % en el gráfico de autocorrelación parcial de la muestra (la mayoría de los programas de software que generan gráficos de autocorrelación de la muestra también trazan este intervalo de confianza). Si el programa de software no genera la banda de confianza, es aproximadamente , donde N denota el tamaño de la muestra.

La función de autocorrelación de un proceso MA( q ) se vuelve cero en un desfase q  + 1 y mayor, por lo que examinamos la función de autocorrelación de muestra para ver dónde se vuelve esencialmente cero. Para ello, colocamos el intervalo de confianza del 95 % para la función de autocorrelación de muestra en el gráfico de autocorrelación de muestra. La mayoría del software que puede generar el gráfico de autocorrelación también puede generar este intervalo de confianza.

La función de autocorrelación parcial de muestra generalmente no es útil para identificar el orden del proceso de promedio móvil.

La siguiente tabla resume cómo se puede utilizar la función de autocorrelación de muestra para la identificación del modelo.

Hyndman y Athanasopoulos sugieren lo siguiente: [4]

Los datos pueden seguir un modelo ARIMA( p , d ,0) si los gráficos ACF y PACF de los datos diferenciados muestran los siguientes patrones:
  • La ACF decae exponencialmente o es sinusoidal;
  • Hay un pico significativo en el rezago p en PACF, pero ninguno más allá del rezago p .
Los datos pueden seguir un modelo ARIMA(0, d , q ) si los gráficos ACF y PACF de los datos diferenciados muestran los siguientes patrones:
  • La PACF decae exponencialmente o es sinusoidal;
  • Hay un pico significativo en el retraso q en ACF, pero ninguno más allá del retraso q .

En la práctica, las funciones de autocorrelación de la muestra y de autocorrelación parcial son variables aleatorias y no ofrecen la misma imagen que las funciones teóricas. Esto dificulta la identificación del modelo. En particular, los modelos mixtos pueden ser particularmente difíciles de identificar. Aunque la experiencia es útil, desarrollar buenos modelos utilizando estos gráficos de muestra puede implicar mucho ensayo y error.

Estimación del modelo Box-Jenkins

La estimación de los parámetros de los modelos Box-Jenkins implica la aproximación numérica de las soluciones de ecuaciones no lineales. Por este motivo, es habitual utilizar software estadístico diseñado para manejar este enfoque; prácticamente todos los paquetes estadísticos modernos cuentan con esta capacidad. Los principales enfoques para ajustar los modelos Box-Jenkins son los mínimos cuadrados no lineales y la estimación de máxima verosimilitud. La estimación de máxima verosimilitud es generalmente la técnica preferida. Las ecuaciones de verosimilitud para el modelo Box-Jenkins completo son complicadas y no se incluyen aquí. Véase (Brockwell y Davis, 1991) para obtener detalles matemáticos.

Diagnóstico del modelo Box-Jenkins

Supuestos para un proceso univariado estable

El diagnóstico de modelos para modelos Box-Jenkins es similar a la validación de modelos para el ajuste de mínimos cuadrados no lineal.

Es decir, se supone que el término de error A t sigue los supuestos para un proceso univariado estacionario. Los residuos deben ser ruido blanco (o independientes cuando sus distribuciones son normales) extraídos de una distribución fija con una media y una varianza constantes. Si el modelo de Box-Jenkins es un buen modelo para los datos, los residuos deben satisfacer estos supuestos.

Si no se cumplen estos supuestos, es necesario ajustar un modelo más adecuado. Es decir, volver al paso de identificación del modelo e intentar desarrollar un modelo mejor. Es de esperar que el análisis de los residuos pueda proporcionar algunas pistas sobre un modelo más adecuado.

Una forma de evaluar si los residuos del modelo de Box-Jenkins cumplen con los supuestos es generar gráficos estadísticos (incluido un gráfico de autocorrelación) de los residuos. También se puede observar el valor de la estadística de Box-Ljung .

Referencias

  1. ^ Box, George; Jenkins, Gwilym (1970). Análisis de series temporales: pronóstico y control . San Francisco: Holden-Day.
  2. ^ Commandeur, JJF; Koopman, SJ (2007). Introducción al análisis de series temporales en el espacio de estados . Oxford University Press .
  3. ^ Brockwell, Peter J.; Davis, Richard A. (1991). Series temporales: teoría y métodos . Springer-Verlag. pág. 273. Bibcode :1991tstm.book.....B.
  4. ^ Hyndman, Rob J; Athanasopoulos, George. Pronóstico: principios y práctica . Consultado el 18 de mayo de 2015 .

Lectura adicional

Enlaces externos

Dominio público Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.