Retraso distribuido

En estadística y econometría , un modelo de rezago distribuido es un modelo para datos de series de tiempo en el que se utiliza una ecuación de regresión para predecir los valores actuales de una variable dependiente basándose tanto en los valores actuales de una variable explicativa como en los valores rezagados (período pasado) de esta variable explicativa. ^[1]^[2]

El punto de partida para un modelo de rezago distribuido es una estructura supuesta de la forma

y_{t}=a+w_{0}x_{t}+w_{1}x_{t-1}+w_{2}x_{t-2}+...+{\text{error term}}

o la forma

y_{t}=a+w_{0}x_{t}+w_{1}x_{t-1}+w_{2}x_{t-2}+...+w_{n}x_{t-n}+{\text{error term}},

donde y _t es el valor en el período t de la variable dependiente y , a es el término del intercepto que se va a estimar y w _i se llama el peso de rezago (también a estimar) colocado sobre el valor i períodos anteriores de la variable explicativa. X . En la primera ecuación, se supone que la variable dependiente se ve afectada por valores de la variable independiente arbitrariamente en el pasado, por lo que el número de ponderaciones de rezago es infinito y el modelo se denomina modelo de rezago distribuido infinito . En la segunda ecuación alternativa, hay sólo un número finito de ponderaciones de rezago, lo que indica una suposición de que existe un rezago máximo más allá del cual los valores de la variable independiente no afectan a la variable dependiente; Un modelo basado en este supuesto se denomina modelo de rezago distribuido finito .

En un modelo de rezago distribuido infinito, es necesario estimar un número infinito de pesos de rezago; Claramente, esto sólo se puede hacer si se supone alguna estructura para la relación entre los distintos pesos de los rezagos, con toda la infinidad de ellos expresable en términos de un número finito de parámetros subyacentes supuestos. En un modelo de rezago distribuido finito, los parámetros podrían estimarse directamente mediante mínimos cuadrados ordinarios (suponiendo que el número de puntos de datos exceda suficientemente el número de ponderaciones de rezago); sin embargo, dicha estimación puede dar resultados muy imprecisos debido a la extrema multicolinealidad entre los diversos valores rezagados de la variable independiente, por lo que nuevamente puede ser necesario asumir alguna estructura para la relación entre los distintos pesos rezagados.

El concepto de modelos de rezagos distribuidos se generaliza fácilmente al contexto de más de una variable explicativa del lado derecho.

Estimación no estructurada

La forma más sencilla de estimar los parámetros asociados con rezagos distribuidos es mediante mínimos cuadrados ordinarios , suponiendo un rezago máximo fijo , asumiendo errores distribuidos de forma independiente e idéntica , y no imponiendo ninguna estructura a la relación de los coeficientes de los explicadores rezagados entre sí. Sin embargo, a menudo surge la multicolinealidad entre los explicadores rezagados, lo que lleva a una alta varianza de las estimaciones de los coeficientes. $p$

Estimación estructurada

Los modelos de retardo distribuido estructurado son de dos tipos: finitos e infinitos. Los rezagos distribuidos infinitos permiten que el valor de la variable independiente en un momento particular influya en la variable dependiente infinitamente en el futuro, o para decirlo de otra manera, permiten que el valor actual de la variable dependiente sea influenciado por los valores de la variable independiente. eso ocurrió hace infinitamente tiempo; pero más allá de un cierto período de retraso, los efectos disminuyen hacia cero. Los rezagos distribuidos finitos permiten que la variable independiente en un momento particular influya en la variable dependiente solo durante un número finito de períodos.

Retrasos distribuidos finitos

El modelo de retardo distribuido finito estructurado más importante es el modelo de retardo de Almon . ^[3] Este modelo permite que los datos determinen la forma de la estructura del rezago, pero el investigador debe especificar la longitud máxima del rezago; una longitud máxima de rezago especificada incorrectamente puede distorsionar la forma de la estructura de rezago estimada, así como el efecto acumulativo de la variable independiente. El rezago de Almon supone que $k + 1$ pesos de rezago están relacionados con $n + 1$ parámetros subyacentes linealmente estimables $(n < k) a j$ según

w_{i}=\sum _{j=0}^{n}a_{j}i^{j}

para $i=0,\dots ,k.$

Retrasos distribuidos infinitos

El tipo más común de modelo estructurado de rezago distribuido infinito es el rezago geométrico , también conocido como rezago de Koyck . En esta estructura de rezago, los pesos (magnitudes de influencia) de los valores de las variables independientes rezagadas disminuyen exponencialmente con la duración del rezago; Si bien la forma de la estructura de rezagos está totalmente impuesta por la elección de esta técnica, la tasa de disminución así como la magnitud general del efecto están determinadas por los datos. La especificación de la ecuación de regresión es muy sencilla: se incluyen como explicadores (variables del lado derecho de la regresión) el valor rezagado de un período de la variable dependiente y el valor actual de la variable independiente:

y_{t}=a+\lambda y_{t-1}+bx_{t}+{\text{error term}},

dónde . En este modelo, el efecto a corto plazo (mismo período) de un cambio unitario en la variable independiente es el valor de b , mientras que se puede demostrar que el efecto a largo plazo (acumulativo) de un cambio unitario sostenido en la variable independiente es ser $0\leq \lambda <1$

b+\lambda b+\lambda ^{2}b+...=b/(1-\lambda ).

Se han propuesto otros modelos de rezagos distribuidos infinitos para permitir que los datos determinen la forma de la estructura de rezagos. El rezago inverso polinomial ^[4]^[5] supone que los pesos del rezago están relacionados con parámetros subyacentes, linealmente estimables a _j de acuerdo con

w_{i}=\sum _{j=2}^{n}{\frac {a_{j}}{(i+1)^{j}}},

para $i=0,\dots ,\infty .$

La combinación geométrica del rezago ^[6] supone que los pesos de los rezagos están relacionados con parámetros subyacentes linealmente estimables a _j según cualquiera de los dos

w_{i}=\sum _{j=2}^{n}a_{j}(1/j)^{i},

para o $i=0,\dots ,\infty$

w_{i}=\sum _{j=1}^{n}a_{j}[j/(n+1)]^{i},

para $i=0,\dots ,\infty .$

El retardo gamma ^[7] y el retardo racional ^[8] son otras estructuras de retardo distribuido infinitamente.

Modelo de rezago distribuido en estudios de salud.

Los modelos de retardo distribuido fueron introducidos en los estudios relacionados con la salud en 2002 por Zanobetti y Schwartz. ^[9] Welty sugirió la versión bayesiana del modelo en 2007. ^[10] Gasparrini introdujo modelos estadísticos más flexibles en 2010 ^[11] que son capaces de describir dimensiones temporales adicionales de la relación exposición-respuesta y desarrolló una familia de Modelos no lineales de retardo distribuido (DLNM), un marco de modelado que puede representar simultáneamente dependencias no lineales de exposición-respuesta y efectos retardados. ^[12]

El concepto de modelo de retraso distribuido fue aplicado por primera vez a la investigación de cohortes longitudinales por Hsu en 2015, ^[13] estudiando la relación entre PM2.5 y el asma infantil , y un método de retraso distribuido más complicado destinado a dar cabida al análisis de investigación de cohortes longitudinales como el retraso distribuido bayesiano. El modelo de interacción ^[14] de Wilson se desarrolló posteriormente para responder preguntas de investigación similares.

Ver también

Referencias

^ Cromwell, Jeff B.; et al. (1994). Pruebas multivariadas para modelos de series temporales . Publicaciones SAGE. ISBN 0-8039-5440-9.
^ Juez, George G.; Griffiths, William E.; Colina, R. Carter; Lee, Tsoung-Chao (1980). La teoría y práctica de la econometría . Nueva York: Wiley. págs. 637–660. ISBN 0-471-05938-2.
^ Almon, Shirley, "El rezago distribuido entre las apropiaciones de capital y los gastos netos", Econometrica 33, 1965, 178-196.
^ Mitchell, Douglas W. y Speaker, Paul J., "Una técnica de retraso distribuido simple y flexible: el retraso inverso polinómico", Journal of Econometrics 31, 1986, 329-340.
^ Gelles, Gregory M. y Mitchell, Douglas W., "Un teorema de aproximación para el retraso inverso polinómico", Economics Letters 30, 1989, 129-132.
^ Orador, Paul J., Mitchell, Douglas W. y Gelles, Gregory M., "Retrasos de combinación geométrica como estimadores de retrasos distribuidos infinitos y flexibles", Journal of Economic Dynamics and Control 13, 1989, 171-185.
^ Schmidt, Peter (1974). "Una modificación del retraso distribuido de Almon". Revista de la Asociación Estadounidense de Estadística . 69 (347): 679–681. doi :10.1080/01621459.1974.10480188.
^ Jorgenson, Dale W. (1966). "Funciones de retardo distribuidas racionales". Econométrica . 34 (1): 135-149. doi :10.2307/1909858. JSTOR 1909858.
^ Zanobetti, Antonella; Schwartz, Joel; Samoli, Evi; Gryparis, Alexandros; Touloumi, Giota; Atkinson, Richard; Le Tertre, Alain; Bobros, Janos; Celko, Martín; Goren, Ayana; Forsberg, Bertil (enero de 2002). "El patrón temporal de las respuestas de la mortalidad a la contaminación del aire: una evaluación multiurbana del desplazamiento de la mortalidad". Epidemiología . 13 (1): 87–93. doi : 10.1097/00001648-200201000-00014 . ISSN 1044-3983. PMID 11805591. S2CID 25181383.
^ Welty, LJ; Peng, RD; Zeger, SL; Dominici, F. (marzo de 2009). "Modelos de retraso distribuido bayesiano: estimación de los efectos de la contaminación del aire por partículas en la mortalidad diaria". Biometría . 65 (1): 282–291. doi :10.1111/j.1541-0420.2007.01039.x. ISSN 1541-0420. PMID 18422792.
^ Gasparrini, A; Armstrong, B; Kenward, MG (20 de septiembre de 2010). "Modelos no lineales de retardo distribuido". Estadística en Medicina . 29 (21): 2224–2234. doi :10.1002/sim.3940. ISSN 0277-6715. PMC 2998707 . PMID 20812303.
^ "Modelos no lineales de retardo distribuido [paquete R dlnm versión 2.4.6]". cran.r-project.org . 2021-06-15 . Consultado el 17 de septiembre de 2021 .
^ León Hsu, Hsiao-Hsien; Mathilda Chiu, Yueh-Hsiu; Coll, Brent A.; Kloog, Itai; Schwartz, Joel; Lee, Alison; Wright, Robert O.; Wright, Rosalind J. (1 de noviembre de 2015). "Contaminación del aire prenatal por partículas y aparición de asma en niños urbanos. Identificación de ventanas sensibles y diferencias de sexo". Revista Estadounidense de Medicina Respiratoria y de Cuidados Críticos . 192 (9): 1052-1059. doi :10.1164/rccm.201504-0658OC. ISSN 1073-449X. PMC 4642201 . PMID 26176842.
^ Wilson, Ander; Chiu, Yueh-Hsiu Mathilda; Hsu, Hsiao-Hsien León; Wright, Robert O.; Wright, Rosalind J.; Coull, Brent A. (julio de 2017). "Modelos bayesianos de interacción de retardo distribuido para identificar ventanas perinatales de vulnerabilidad en la salud infantil". Bioestadística . 18 (3): 537–552. doi :10.1093/bioestadística/kxx002. ISSN 1465-4644. PMC 5862289 . PMID 28334179.