En estadística y econometría , un modelo de rezago distribuido es un modelo para datos de series de tiempo en el que se utiliza una ecuación de regresión para predecir los valores actuales de una variable dependiente basándose tanto en los valores actuales de una variable explicativa como en los valores rezagados (período pasado) de esta variable explicativa. [1] [2]
El punto de partida para un modelo de rezago distribuido es una estructura supuesta de la forma
o la forma
donde y t es el valor en el período t de la variable dependiente y , a es el término del intercepto que se va a estimar y w i se llama el peso de rezago (también a estimar) colocado sobre el valor i períodos anteriores de la variable explicativa. X . En la primera ecuación, se supone que la variable dependiente se ve afectada por valores de la variable independiente arbitrariamente en el pasado, por lo que el número de ponderaciones de rezago es infinito y el modelo se denomina modelo de rezago distribuido infinito . En la segunda ecuación alternativa, hay sólo un número finito de ponderaciones de rezago, lo que indica una suposición de que existe un rezago máximo más allá del cual los valores de la variable independiente no afectan a la variable dependiente; Un modelo basado en este supuesto se denomina modelo de rezago distribuido finito .
En un modelo de rezago distribuido infinito, es necesario estimar un número infinito de pesos de rezago; Claramente, esto sólo se puede hacer si se supone alguna estructura para la relación entre los distintos pesos de los rezagos, con toda la infinidad de ellos expresable en términos de un número finito de parámetros subyacentes supuestos. En un modelo de rezago distribuido finito, los parámetros podrían estimarse directamente mediante mínimos cuadrados ordinarios (suponiendo que el número de puntos de datos exceda suficientemente el número de ponderaciones de rezago); sin embargo, dicha estimación puede dar resultados muy imprecisos debido a la extrema multicolinealidad entre los diversos valores rezagados de la variable independiente, por lo que nuevamente puede ser necesario asumir alguna estructura para la relación entre los distintos pesos rezagados.
El concepto de modelos de rezagos distribuidos se generaliza fácilmente al contexto de más de una variable explicativa del lado derecho.
La forma más sencilla de estimar los parámetros asociados con rezagos distribuidos es mediante mínimos cuadrados ordinarios , suponiendo un rezago máximo fijo , asumiendo errores distribuidos de forma independiente e idéntica , y no imponiendo ninguna estructura a la relación de los coeficientes de los explicadores rezagados entre sí. Sin embargo, a menudo surge la multicolinealidad entre los explicadores rezagados, lo que lleva a una alta varianza de las estimaciones de los coeficientes.
Los modelos de retardo distribuido estructurado son de dos tipos: finitos e infinitos. Los rezagos distribuidos infinitos permiten que el valor de la variable independiente en un momento particular influya en la variable dependiente infinitamente en el futuro, o para decirlo de otra manera, permiten que el valor actual de la variable dependiente sea influenciado por los valores de la variable independiente. eso ocurrió hace infinitamente tiempo; pero más allá de un cierto período de retraso, los efectos disminuyen hacia cero. Los rezagos distribuidos finitos permiten que la variable independiente en un momento particular influya en la variable dependiente solo durante un número finito de períodos.
El modelo de retardo distribuido finito estructurado más importante es el modelo de retardo de Almon . [3] Este modelo permite que los datos determinen la forma de la estructura del rezago, pero el investigador debe especificar la longitud máxima del rezago; una longitud máxima de rezago especificada incorrectamente puede distorsionar la forma de la estructura de rezago estimada, así como el efecto acumulativo de la variable independiente. El rezago de Almon supone que k + 1 pesos de rezago están relacionados con n + 1 parámetros subyacentes linealmente estimables ( n < k ) a j según
para
El tipo más común de modelo estructurado de rezago distribuido infinito es el rezago geométrico , también conocido como rezago de Koyck . En esta estructura de rezago, los pesos (magnitudes de influencia) de los valores de las variables independientes rezagadas disminuyen exponencialmente con la duración del rezago; Si bien la forma de la estructura de rezagos está totalmente impuesta por la elección de esta técnica, la tasa de disminución así como la magnitud general del efecto están determinadas por los datos. La especificación de la ecuación de regresión es muy sencilla: se incluyen como explicadores (variables del lado derecho de la regresión) el valor rezagado de un período de la variable dependiente y el valor actual de la variable independiente:
dónde . En este modelo, el efecto a corto plazo (mismo período) de un cambio unitario en la variable independiente es el valor de b , mientras que se puede demostrar que el efecto a largo plazo (acumulativo) de un cambio unitario sostenido en la variable independiente es ser
Se han propuesto otros modelos de rezagos distribuidos infinitos para permitir que los datos determinen la forma de la estructura de rezagos. El rezago inverso polinomial [4] [5] supone que los pesos del rezago están relacionados con parámetros subyacentes, linealmente estimables a j de acuerdo con
para
La combinación geométrica del rezago [6] supone que los pesos de los rezagos están relacionados con parámetros subyacentes linealmente estimables a j según cualquiera de los dos
para o
para
El retardo gamma [7] y el retardo racional [8] son otras estructuras de retardo distribuido infinitamente.
Los modelos de retardo distribuido fueron introducidos en los estudios relacionados con la salud en 2002 por Zanobetti y Schwartz. [9] Welty sugirió la versión bayesiana del modelo en 2007. [10] Gasparrini introdujo modelos estadísticos más flexibles en 2010 [11] que son capaces de describir dimensiones temporales adicionales de la relación exposición-respuesta y desarrolló una familia de Modelos no lineales de retardo distribuido (DLNM), un marco de modelado que puede representar simultáneamente dependencias no lineales de exposición-respuesta y efectos retardados. [12]
El concepto de modelo de retraso distribuido fue aplicado por primera vez a la investigación de cohortes longitudinales por Hsu en 2015, [13] estudiando la relación entre PM2.5 y el asma infantil , y un método de retraso distribuido más complicado destinado a dar cabida al análisis de investigación de cohortes longitudinales como el retraso distribuido bayesiano. El modelo de interacción [14] de Wilson se desarrolló posteriormente para responder preguntas de investigación similares.