Modelo de ecuaciones simultáneas

Los modelos de ecuaciones simultáneas son un tipo de modelo estadístico en el que las variables dependientes son funciones de otras variables dependientes, en lugar de solo variables independientes. ^[1] Esto significa que algunas de las variables explicativas se determinan conjuntamente con la variable dependiente, que en economía suele ser la consecuencia de algún mecanismo de equilibrio subyacente . Tomemos el modelo típico de oferta y demanda : si bien normalmente se determinaría que la cantidad ofrecida y demandada es una función del precio establecido por el mercado, también es posible que ocurra lo contrario, en el que los productores observan la cantidad que demandan los consumidores y luego establecen el precio. ^[2]

La simultaneidad plantea desafíos para la estimación de los parámetros estadísticos de interés, porque se viola el supuesto de Gauss-Markov de estricta exogeneidad de los regresores. Y si bien sería natural estimar todas las ecuaciones simultáneas a la vez, esto a menudo conduce a un problema de optimización no lineal computacionalmente costoso incluso para el sistema más simple de ecuaciones lineales . ^[3] Esta situación impulsó el desarrollo, encabezado por la Comisión Cowles en los años 1940 y 1950, ^[4] de varias técnicas que estiman cada ecuación en el modelo en serie, más notablemente la máxima verosimilitud con información limitada y los mínimos cuadrados en dos etapas . ^[5]

Forma estructural y reducida

Supongamos que hay m ecuaciones de regresión de la forma

y_{it}=y_{-i,t}'\gamma _{i}+x_{it}'\;\!\beta _{i}+u_{it},\quad i=1,\ldots ,m,

donde i es el número de ecuación, y t = 1, ..., T es el índice de observación. En estas ecuaciones x _es el vector k _i × 1 de variables exógenas, y _es la variable dependiente, y _−i,t es el vector n _i × 1 de todas las demás variables endógenas que entran en la i ^ésima ecuación en el lado derecho, y u _son los términos de error. La notación “− i ” indica que el vector y _−i,t puede contener cualquiera de las y excepto y _it (ya que ya está presente en el lado izquierdo). Los coeficientes de regresión β _i y γ _i son de dimensiones k _i × 1 y n _i × 1 correspondientemente. Apilando verticalmente las T observaciones correspondientes a la i ^ésima ecuación, podemos escribir cada ecuación en forma vectorial como

y_{i}=Y_{-i}\gamma _{i}+X_{i}\beta _{i}+u_{i},\quad i=1,\ldots ,m,

donde y _i y u _i son vectores T× 1, X _i es una matriz T×k _i de regresores exógenos, e Y _−i es una matriz T×n _i de regresores endógenos en el lado derecho de la i- ^ésima ecuación. Finalmente, podemos mover todas las variables endógenas al lado izquierdo y escribir las m ecuaciones conjuntamente en forma vectorial como

Y\Gamma =X\mathrm {B} +U.\,

Esta representación se conoce como forma estructural . En esta ecuación Y = [ y ₁ y ₂ ... y _m ] es la matriz T×m de variables dependientes. Cada una de las matrices Y _−i es de hecho una submatriz de n _i columnas de esta Y . La matriz m×m Γ, que describe la relación entre las variables dependientes, tiene una estructura complicada. Tiene unos en la diagonal, y todos los demás elementos de cada columna i son los componentes del vector −γ _i o ceros, dependiendo de qué columnas de Y se incluyeron en la matriz Y _−i . La matriz T×k X contiene todos los regresores exógenos de todas las ecuaciones, pero sin repeticiones (es decir, la matriz X debe ser de rango completo). Por lo tanto, cada X _i es una submatriz de k _i columnas de X . La matriz Β tiene un tamaño k×m y cada una de sus columnas está formada por los componentes de los vectores β _i y ceros, dependiendo de cuáles de los regresores de X se incluyeron o excluyeron de X _i . Finalmente, U = [ u ₁ u ₂ ... u _m ] es una matriz T×m de los términos de error.

Después de multiplicar la ecuación estructural por Γ ⁻¹ , el sistema se puede escribir en forma reducida como

Y=X\mathrm {B}\Gamma ^{-1}+U\Gamma ^{-1}=X\Pi +V.\,

Este es ya un modelo lineal general simple , y puede estimarse, por ejemplo, mediante mínimos cuadrados ordinarios . Desafortunadamente, la tarea de descomponer la matriz estimada en los factores individuales Β y Γ ⁻¹ es bastante complicada, y por lo tanto, la forma reducida es más adecuada para la predicción, pero no para la inferencia. $\scriptstyle {\hat {\Pi }}$

Suposiciones

En primer lugar, el rango de la matriz X de regresores exógenos debe ser igual a k , tanto en muestras finitas como en el límite cuando T → ∞ (este último requisito significa que en el límite la expresión debe converger a una matriz k×k no degenerada ). También se supone que la matriz Γ no es degenerada. $\scriptstyle {\frac {1}{T}}X'\!X$

En segundo lugar, se supone que los términos de error son serialmente independientes y se distribuyen de manera idéntica . Es decir, si la ^filat de la matriz U se denota por u ₍_t₎ , entonces la secuencia de vectores { u ₍_t₎ } debería ser iid, con media cero y alguna matriz de covarianza Σ (que es desconocida). En particular, esto implica que E[ U ] = 0 , y E[ U′U ] = T Σ .

Por último, se requieren suposiciones para la identificación.

Identificación

Las condiciones de identificación requieren que el sistema de ecuaciones lineales sea resoluble para los parámetros desconocidos.

Más específicamente, la condición de orden , una condición necesaria para la identificación, es que para cada ecuación $k i + n i \leq k$ , lo que puede expresarse como “el número de variables exógenas excluidas es mayor o igual al número de variables endógenas incluidas”.

La condición de rango , una condición más fuerte que es necesaria y suficiente, es que el rango de $Π i 0$ sea igual $a n i$ , donde $Π i 0$ es una matriz $(k - k i)\times n i$ que se obtiene a partir de $Π$ tachando las columnas que corresponden a las variables endógenas excluidas y las filas que corresponden a las variables exógenas incluidas.

Uso de restricciones entre ecuaciones para lograr la identificación

En los modelos de ecuaciones simultáneas, el método más común para lograr la identificación es imponer restricciones de parámetros dentro de la ecuación. ^[6] Sin embargo, la identificación también es posible utilizando restricciones entre ecuaciones.

Para ilustrar cómo se pueden utilizar las restricciones de ecuaciones cruzadas para la identificación, considere el siguiente ejemplo de Wooldridge ^[6]

{\begin{aligned}y_{1}&=\gamma _{12}y_{2}+\delta _{11}z_{1}+\delta _{12}z_{2}+\delta _{13}z_{3}+u_{1}\\y_{2}&=\gamma _{21}y_{1}+\delta _{21}z_{1}+\delta _{22}z_{2}+u_{2}\end{aligned}}

donde las z no están correlacionadas con las u y las y son variables endógenas . Sin más restricciones, la primera ecuación no se identifica porque no hay ninguna variable exógena excluida. La segunda ecuación se identifica simplemente si $δ 13 \neq0$ , lo que se supone que es cierto para el resto de la discusión.

Ahora imponemos la restricción de la ecuación cruzada de $δ 12 = δ 22$ . Dado que la segunda ecuación está identificada, podemos tratar $δ 12$ como conocida para fines de identificación. Entonces, la primera ecuación se convierte en:

y_{1}-\delta _{12}z_{2}=\gamma _{12}y_{2}+\delta _{11}z_{1}+\delta _{13}z_{3}+u_{1}

Luego, podemos usar $(z 1, z 2, z 3)$ como instrumentos para estimar los coeficientes en la ecuación anterior, ya que hay una variable endógena ( $y 2$ ) y una variable exógena excluida ( $z 2$ ) en el lado derecho. Por lo tanto, las restricciones entre ecuaciones en lugar de las restricciones dentro de la ecuación pueden lograr la identificación.

Estimación

Mínimos cuadrados en dos etapas (2SLS)

El método de estimación más simple y más común para el modelo de ecuaciones simultáneas es el llamado método de mínimos cuadrados de dos etapas , ^[7] desarrollado independientemente por Theil (1953) y Basmann (1957). ^[8]^[9]^[10] Es una técnica ecuación por ecuación, donde los regresores endógenos en el lado derecho de cada ecuación se instrumentan con los regresores X de todas las demás ecuaciones. El método se llama "de dos etapas" porque realiza la estimación en dos pasos: ^[7]

Paso 1 : Regresar Y _−i sobre X y obtener los valores predichos ;

\scriptstyle {\hat {Y}}_{\!-i}

Paso 2 : Estime γ _i , β _i mediante la regresión de mínimos cuadrados ordinarios de y _i en y X _i .

\scriptstyle {\hat {Y}}_{\!-i}

Si la i- ^ésima ecuación del modelo se escribe como

y_{i}={\begin{pmatrix}Y_{-i}&X_{i}\end{pmatrix}}{\begin{pmatrix}\gamma _{i}\\\beta _{i}\end{pmatrix}}+u_{i}\equiv Z_{i}\delta _{i}+u_{i},

donde Z _i es una matriz T× ( n _i + k _i ) de regresores endógenos y exógenos en la i ^ésima ecuación, y δ _i es un vector ( n _i + k _i )-dimensional de coeficientes de regresión, entonces el estimador 2SLS de δ _i estará dado por ^[7]

{\hat {\delta }}_{i}={\big (}{\hat {Z}}'_{i}{\hat {Z}}_{i}{\big )}^{-1}{\hat {Z}}'_{i}y_{i}={\big (}Z'_{i}PZ_{i}{\big )}^{-1}Z'_{i}Py_{i},

donde P = X ( X ′ X ) ⁻¹X ′ es la matriz de proyección sobre el espacio lineal abarcado por los regresores exógenos X .

Mínimos cuadrados indirectos

Los mínimos cuadrados indirectos son un método econométrico en el que los coeficientes de un modelo de ecuaciones simultáneas se estiman a partir del modelo de forma reducida utilizando mínimos cuadrados ordinarios . ^[11]^[12] Para ello, el sistema estructural de ecuaciones se transforma primero en la forma reducida. Una vez estimados los coeficientes, el modelo se vuelve a poner en la forma estructural.

Máxima verosimilitud con información limitada (LIML)

El método de máxima verosimilitud de “información limitada” fue sugerido por MA Girshick en 1947, ^[13] y formalizado por TW Anderson y H. Rubin en 1949. ^[14] Se utiliza cuando uno está interesado en estimar una sola ecuación estructural a la vez (de ahí su nombre de información limitada), digamos para la observación i:

y_{i}=Y_{-i}\gamma _{i}+X_{i}\beta _{i}+u_{i}\equiv Z_{i}\delta _{i}+u_{i}

Las ecuaciones estructurales para las variables endógenas restantes Y _−i no se especifican y se dan en su forma reducida:

Y_{-i}=X\Pi +U_{-i}

La notación en este contexto es diferente a la del caso IV simple . Se tiene:

$Y_{-i}$ :La(s) variable(s) endógena(s).
$X_{-i}$ :La(s) variable(s) exógena(s)
$X$ :El instrumento(s) (a menudo denominado ) $Z$

La fórmula explícita para el LIML es: ^[15]

{\hat {\delta }}_{i}={\Big (}Z'_{i}(I-\lambda M)Z_{i}{\Big )}^{\!-1}Z'_{i}(I-\lambda M)y_{i},

donde M = I − X ( X ′ X ) ⁻¹X ′ , y λ es la raíz característica más pequeña de la matriz:

{\Big (}{\begin{bmatrix}y_{i}\\Y_{-i}\end{bmatrix}}M_{i}{\begin{bmatrix}y_{i}&Y_{-i}\end{bmatrix}}{\Big )}{\Big (}{\begin{bmatrix}y_{i}\\Y_{-i}\end{bmatrix}}M{\begin{bmatrix}y_{i}&Y_{-i}\end{bmatrix}}{\Big )}^{\!-1}

donde, de manera similar, M _i = I − X _i ( X _i ′ X _i ) ⁻¹X _i ′ .

En otras palabras, λ es la solución más pequeña del problema del valor propio generalizado , véase Theil (1971, pág. 503):

{\Big |}{\begin{bmatrix}y_{i}&Y_{-i}\end{bmatrix}}'M_{i}{\begin{bmatrix}y_{i}&Y_{-i}\end{bmatrix}}-\lambda {\begin{bmatrix}y_{i}&Y_{-i}\end{bmatrix}}'M{\begin{bmatrix}y_{i}&Y_{-i}\end{bmatrix}}{\Big |}=0

Estimadores de clase K

El LIML es un caso especial de los estimadores de clase K: ^[16]

{\hat {\delta }}={\Big (}Z'(I-\kappa M)Z{\Big )}^{\!-1}Z'(I-\kappa M)y,

con:

$\delta ={\begin{bmatrix}\beta _{i}&\gamma _{i}\end{bmatrix}}$
$Z={\begin{bmatrix}X_{i}&Y_{-i}\end{bmatrix}}$

A esta clase pertenecen varios estimadores:

κ=0: MCO
κ=1: 2SLS. Nótese que en este caso, la matriz de proyección habitual de la 2SLS $I-\kappa M=I-M=P$
κ=λ: LIM
κ=λ - α / (nK): estimador de Fuller (1977). ^[17] Aquí K representa el número de instrumentos, n el tamaño de la muestra y α una constante positiva para especificar. Un valor de α=1 producirá un estimador que es aproximadamente insesgado. ^[16]

Mínimos cuadrados en tres etapas (3SLS)

El estimador de mínimos cuadrados en tres etapas fue introducido por Zellner y Theil (1962). ^[18]^{[19] Puede verse como un caso especial de}GMM multiecuación donde el conjunto de variables instrumentales es común a todas las ecuaciones. ^[20] Si todos los regresores están de hecho predeterminados, entonces 3SLS se reduce a regresiones aparentemente no relacionadas (SUR). Por lo tanto, también puede verse como una combinación de mínimos cuadrados en dos etapas (2SLS) con SUR.

Aplicaciones en las ciencias sociales

En todos los campos y disciplinas, los modelos de ecuaciones simultáneas se aplican a varios fenómenos observacionales. Estas ecuaciones se aplican cuando se supone que los fenómenos son recíprocamente causales. El ejemplo clásico es la oferta y la demanda en economía . En otras disciplinas hay ejemplos como las evaluaciones de candidatos y la identificación de partidos ^[21] o la opinión pública y la política social en la ciencia política ; ^[22]^[23] la inversión en carreteras y la demanda de viajes en geografía; ^[24] y el logro educativo y la entrada de los padres en la sociología o la demografía . ^[25] El modelo de ecuaciones simultáneas requiere una teoría de causalidad recíproca que incluya características especiales si los efectos causales se van a estimar como retroalimentación simultánea en oposición a "bloques" unilaterales de una ecuación donde un investigador está interesado en el efecto causal de X sobre Y mientras mantiene constante el efecto causal de Y sobre X, o cuando el investigador sabe la cantidad exacta de tiempo que tarda en producirse cada efecto causal, es decir, la longitud de los rezagos causales. En lugar de efectos rezagados, la retroalimentación simultánea significa estimar el impacto simultáneo y perpetuo de X e Y entre sí. Esto requiere una teoría que sostenga que los efectos causales son simultáneos en el tiempo, o tan complejos que parecen comportarse simultáneamente; un ejemplo común son los estados de ánimo de los compañeros de habitación. ^[26] Para estimar modelos de retroalimentación simultánea también es necesaria una teoría del equilibrio: que X e Y se encuentren en estados relativamente estables o sean parte de un sistema (sociedad, mercado, aula) que se encuentre en un estado relativamente estable. ^[27]

Véase también

Referencias

^ Martin, Vance; Hurn, Stan; Harris, David (2013). Modelado econométrico con series temporales . Cambridge University Press. pág. 159. ISBN 978-0-521-19660-4.
^ Maddala, GS; Lahiri, Kajal (2009). Introducción a la econometría (cuarta edición). Wiley. pp. 355–357. ISBN 978-0-470-01512-4.
^ Quandt, Richard E. (1983). "Problemas y métodos computacionales". En Griliches, Z.; Intriligator, MD (eds.). Manual de econometría . Vol. I. Holanda Septentrional. págs. 699–764. ISBN 0-444-86185-8.
^ Christ, Carl F. (1994). "Las contribuciones de la Comisión Cowles a la econometría en Chicago, 1939-1955". Revista de literatura económica . 32 (1): 30-59. JSTOR 2728422.
^ Johnston, J. (1971). "Métodos de ecuaciones simultáneas: estimación". Métodos econométricos (segunda edición). Nueva York: McGraw-Hill. pp. 376–423. ISBN 0-07-032679-7.
^ ab Wooldridge, JM, Análisis econométrico de datos de sección transversal y de panel, MIT Press, Cambridge, Mass.
^ abc Greene, William H. (2002). Análisis econométrico (5.ª ed.). Prentice Hall. pp. 398–99. ISBN 0-13-066189-9.
^ Theil, H. (1953). Estimación y correlación simultánea en sistemas de ecuaciones completos (Memorando). Oficina Central de Planificación.Reimpreso en Contribuciones de Henri Theil a la economía y la econometría (Springer, 1992), doi :10.1007/978-94-011-2546-8_6.
^ Basmann, RL (1957). "Un método clásico generalizado de estimación lineal de coeficientes en una ecuación estructural". Econometrica . 25 (1): 77–83. doi :10.2307/1907743. JSTOR 1907743.
^ Theil, Henri (1971). Principios de econometría . Nueva York: John Wiley.
^ Park, SB. (1974) "Sobre la estimación indirecta de mínimos cuadrados de un sistema de ecuaciones simultáneas", The Canadian Journal of Statistics / La Revue Canadienne de Statistique , 2 (1), 75–82 JSTOR 3314964
^ Vajda, S.; Valko, P.; Godfrey, KR (1987). "Métodos de mínimos cuadrados directos e indirectos en la estimación de parámetros en tiempo continuo". Automatica . 23 (6): 707–718. doi :10.1016/0005-1098(87)90027-6.
^ Primera aplicación por Girshick, MA; Haavelmo, Trygve (1947). "Análisis estadístico de la demanda de alimentos: ejemplos de estimación simultánea de ecuaciones estructurales". Econometrica . 15 (2): 79–110. doi :10.2307/1907066. JSTOR 1907066.
^ Anderson, TW; Rubin, H. (1949). "Estimador de los parámetros de una sola ecuación en un sistema completo de ecuaciones estocásticas". Anales de estadística matemática . 20 (1): 46–63. doi : 10.1214/aoms/1177730090 . JSTOR 2236803.
^ Amemiya, Takeshi (1985). Econometría avanzada . Cambridge, Massachusetts: Harvard University Press. pág. 235. ISBN. 0-674-00560-0.
^ ab Davidson, Russell; MacKinnon, James G. (1993). Estimación e inferencia en econometría . Oxford University Press. pág. 649. ISBN 0-19-506011-3.
^ Fuller, Wayne (1977). "Algunas propiedades de una modificación del estimador de información limitada". Econometrica . 45 (4): 939–953. doi :10.2307/1912683. JSTOR 1912683.
^ Zellner, Arnold ; Theil, Henri (1962). "Mínimos cuadrados en tres etapas: estimación simultánea de ecuaciones simultáneas". Econometrica . 30 (1): 54–78. doi :10.2307/1911287. JSTOR 1911287.
^ Kmenta, Jan (1986). "Métodos de estimación de sistemas". Elements of Econometrics (segunda edición). Nueva York: Macmillan. págs. 695–701. ISBN 9780023650703.
^ Hayashi, Fumio (2000). "Multiple-Equation GMM". Econometría . Princeton University Press. págs. 276-279. ISBN 1400823838.
^ Page, Benjamin I.; Jones, Calvin C. (1979-12-01). "Efectos recíprocos de las preferencias políticas, las lealtades partidarias y el voto". American Political Science Review . 73 (4): 1071–1089. doi :10.2307/1953990. ISSN 0003-0554. JSTOR 1953990. S2CID 144984371.
^ Wlezien, Christopher (1 de enero de 1995). "El público como termostato: dinámica de las preferencias de gasto". Revista estadounidense de ciencias políticas . 39 (4): 981–1000. doi :10.2307/2111666. JSTOR 2111666.
^ Breznau, Nate (1 de julio de 2016). "Retornos positivos y equilibrio: retroalimentación simultánea entre la opinión pública y la política social". Revista de estudios de políticas . 45 (4): 583–612. doi :10.1111/psj.12171. ISSN 1541-0072.
^ Xie, F.; Levinson, D. (1 de mayo de 2010). "Cómo los tranvías moldearon la suburbanización: un análisis de causalidad de Granger del uso del suelo y el transporte público en las Twin Cities". Journal of Economic Geography . 10 (3): 453–470. doi :10.1093/jeg/lbp031. hdl : 11299/179996 . ISSN 1468-2702.
^ Marini, Margaret Mooney (1 de enero de 1984). "El nivel educativo de las mujeres y el momento de su ingreso a la maternidad". American Sociological Review . 49 (4): 491–511. doi :10.2307/2095464. JSTOR 2095464.
^ Wong, Chi-Sum; Law, Kenneth S. (1 de enero de 1999). "Prueba de relaciones recíprocas mediante modelos de ecuaciones estructurales no recursivas utilizando datos transversales". Métodos de investigación organizacional . 2 (1): 69–87. doi :10.1177/109442819921005. ISSN 1094-4281. S2CID 122284566.
^ 2013. “Dinámica de flechas inversas: bucles de retroalimentación y medición formativa”. En Structural Equation Modeling: A Second Course , editado por Gregory R. Hancock y Ralph O. Mueller, 2.ª ed., 41–79. Charlotte, NC: Information Age Publishing

Lectura adicional

Asteriou, Dimitrios; Hall, Stephen G. (2011). Econometría aplicada (segunda edición). Basingstoke: Palgrave Macmillan. pág. 395. ISBN 978-0-230-27182-1.
Chow, Gregory C. (1983). Econometría . Nueva York: McGraw-Hill. Págs. 117-121. ISBN. 0-07-010847-1.
Fomby, Thomas B.; Hill, R. Carter; Johnson, Stanley R. (1984). "Modelos de ecuaciones simultáneas". Métodos econométricos avanzados . Nueva York: Springer. págs. 437–552. ISBN 0-387-90908-7.
Maddala, GS ; Lahiri, Kajal (2009). "Modelos de ecuaciones simultáneas". Introducción a la econometría (cuarta edición). Nueva York: Wiley. págs. 355–400. ISBN 978-0-470-01512-4.
Ruud, Paul A. (2000). "Ecuaciones simultáneas". Introducción a la teoría econométrica clásica . Oxford University Press. pp. 697–746. ISBN 0-19-511164-8.
Sargan, Denis (1988). Lecciones sobre teoría econométrica avanzada . Oxford: Basil Blackwell. pp. 68–89. ISBN. 0-631-14956-2.
Wooldridge, Jeffrey M. (2013). "Modelos de ecuaciones simultáneas". Introducción a la econometría (quinta edición). South-Western. págs. 554–582. ISBN 978-1-111-53104-1.

Enlaces externos

Conferencia sobre el problema de identificación en 2SLS y estimación en YouTube por Mark Thoma