En estadística, econometría, epidemiología y disciplinas afines, el método de variables instrumentales (VV.
se utiliza para estimar relaciones causales cuando los experimentos controlados no son factibles o cuando un tratamiento no es administrado exitosamente a cada unidad en un experimento aleatorio.
son usadas cuando una variable explicativa de interés está correlacionada con el término de error, en cuyo caso los mínimos cuadrados ordinarios and ANOVA dan resultados sesgados.
En esta situación, la regresión lineal produce estimaciones sesgadas e inconsistentes.
[2] Sin embargo, si un instrumento está disponible, aún puede obtenerse estimaciones consistentes.
Un instrumento es una variable que no pertenece en sí a la ecuación explicativa pero se correlaciona con las variables explicativas endógenas, condicionalment a las otras covariables.
En los modelos lineales, hay dos requisitos principales para el uso de VV.
: Hay varias definiciones formales de lo que son las variables instrumentales, utilizando contrafácticos y criterios gráficos, están dadas por Judea Pearl (2000).
[5] La teoría de las variables instrumentales se obtuvo por primera vez por Philip G. Wright en su libro de 1928 The Tariff on Animal and Vegetable Oils.
Por ejemplo, considere el caso de un investigador que quiere estimar el efecto causal del tabaquismo sobre la salud en general (como Leigh y Schembri 2004[7]).
Supongamos que los datos son generados por un proceso de la forma: donde El parámetro
están correlacionadas , bajo ciertas condiciones de regularidad el segundo término tiene un valor esperado condicional en x igual a cero y converge a cero en el límite, por lo que el estimador es imparcial y consistente.
Cuando x y las otras, las variables causales no medidos se derrumbaron en el \ Varepsilon término se correlacionan, sin embargo, el estimador MCO es generalmente sesgado e inconsistente de β.
Utilizando el método de los momentos , tener expectativas condicionales en z para encontrar El segundo término del lado derecho es cero por supuesto.
no están correlacionadas, el término final, bajo ciertas condiciones de regularidad, se aproxima a cero en el límite, proporcionando un estimador consistente.
El enfoque se generaliza a un modelo con múltiples variables explicativas.
Entonces se puede demostrar que el estimador es consistente bajo una generalización multivariante de las afecciones expuestas anteriormente.
Un método computacional que puede ser utilizado para computar las estimaciones de las VV. II.
En la primera etapa, cada variable explicativa que es una covariable endógena en la ecuación de interés es retrocedido en todas las variables exógenas en el modelo, incluyendo ambas covariables exógenos en la ecuación de interés y los instrumentos excluidos.
En la regresión de variable instrumental, si tenemos múltiples regresores endógenos
son dos funciones arbitrarias y Z es independiente de los U .
En general, distintos sujetos responderan de manera diferente a los cambios en el "tratamiento" x.
invocan suposiciones implícitas en la respuesta de comportamiento, o más generalmente suposiciones sobre la correlación entre la respuesta al tratamiento y la propensión a recibir el tratamiento.
[1] Imbens y Angrist (1994) demostraron que la estimación lineal de las VV. II.
puede interpretarse en condiciones débiles como la media ponderada de los efectos locales del tratamiento, donde los pesos dependen de la elasticidad del regresor endógeno a los cambios en las variables instrumentales.
Aproximadamente, eso significa que el efecto de una variable sólo se revela para las subpoblaciones afectadas por los cambios observados en los instrumentos, y que las subpoblaciones que responden más a los cambios en los instrumentos tendrán los efectos más grandes en la magnitud de la estimación de las VV. II.
Este enfoque empírico , sin más suposiciones, no dice el investigador nada sobre el efecto de la universidad entre las personas que ya sea siempre o nunca conseguirían un título universitario, independientemente de si existe o no una universidad local.
[10] En este caso, la predicción del predictor de la pregunta por el instrumento será pobre y los valores previstos tendrán muy poca variación.
En consecuencia, es poco probable que tengan mucho éxito en la predicción del resultado final cuando se utilizan para reemplazar a la pregunta predictor en la ecuación de la segunda etapa.
En el contexto del ejemplo sobre el tabaquismo y la salud analizado anteriormente, los impuestos sobre el tabaco son instrumentos débiles para fumar si el tabaquismo no responde en gran medida a los cambios en los impuestos.