stringtranslate.com

Modelo de ecuaciones simultáneas

Los modelos de ecuaciones simultáneas son un tipo de modelo estadístico en el que las variables dependientes son funciones de otras variables dependientes, en lugar de solo variables independientes. [1] Esto significa que algunas de las variables explicativas se determinan conjuntamente con la variable dependiente, que en economía suele ser consecuencia de algún mecanismo de equilibrio subyacente . Tomemos el modelo típico de oferta y demanda : si bien normalmente se determinaría que la cantidad ofrecida y demandada es una función del precio fijado por el mercado, también es posible que ocurra lo contrario, donde los productores observan la cantidad que los consumidores demandan y luego fijar el precio. [2]

La simultaneidad plantea desafíos para la estimación de los parámetros estadísticos de interés, porque se viola el supuesto de Gauss-Markov de exogeneidad estricta de los regresores. Y si bien sería natural estimar todas las ecuaciones simultáneas a la vez, esto a menudo conduce a un problema de optimización no lineal computacionalmente costoso incluso para el sistema de ecuaciones lineales más simple . [3] Esta situación impulsó el desarrollo, encabezado por la Comisión Cowles en las décadas de 1940 y 1950, [4] de varias técnicas que estiman cada ecuación en el modelo en serie, en particular información limitada de máxima verosimilitud y mínimos cuadrados de dos etapas . [5]

Forma estructural y reducida

Supongamos que hay m ecuaciones de regresión de la forma

donde i es el número de ecuación y t = 1, ..., T es el índice de observación. En estas ecuaciones x es el vector k i × 1 de variables exógenas, y es la variable dependiente, y −i,t es el vector n i × 1 de todas las demás variables endógenas que entran en la i -ésima ecuación de la derecha. lado derecho, y u son los términos de error. La notación “−i indica que el vector y −i,t puede contener cualquiera de los y excepto y it (ya que ya está presente en el lado izquierdo). Los coeficientes de regresión β i y γ i tienen dimensiones k i × 1 y n i × 1 respectivamente. Apilando verticalmente las T observaciones correspondientes a la i- ésima ecuación, podemos escribir cada ecuación en forma vectorial como

donde y i y u i son vectores 1, X i es una matriz T×k i de regresores exógenos, y Y −i es una matriz T×n i de regresores endógenos en el lado derecho de la i -ésima ecuación . Finalmente, podemos mover todas las variables endógenas al lado izquierdo y escribir las m ecuaciones conjuntamente en forma vectorial como

Esta representación se conoce como forma estructural . En esta ecuación Y = [ y 1 y 2 ... y m ] es la matriz T×m de variables dependientes. Cada una de las matrices Y −i es de hecho una submatriz de n i columnas de esta Y . La matriz m×m Γ, que describe la relación entre las variables dependientes, tiene una estructura complicada. Tiene unos en la diagonal, y todos los demás elementos de cada columna i son componentes del vector −γ i o ceros, dependiendo de qué columnas de Y se incluyeron en la matriz Y −i . La matriz X T×k contiene todos los regresores exógenos de todas las ecuaciones, pero sin repeticiones (es decir, la matriz X debe ser de rango completo). Por lo tanto, cada X i es una submatriz de columnas k i de X . La matriz Β tiene un tamaño k×m y cada una de sus columnas consta de los componentes de los vectores β i y ceros, dependiendo de cuál de los regresores de X se incluyó o excluyó de X i . Finalmente, U = [ u 1 u 2 ... u m ] es una matriz T×m de los términos de error.

Después de multiplicar la ecuación estructural por Γ  −1 , el sistema se puede escribir en forma reducida como

Éste ya es un modelo lineal general simple y puede estimarse, por ejemplo, mediante mínimos cuadrados ordinarios . Desafortunadamente, la tarea de descomponer la matriz estimada en los factores individuales Β y Γ  −1 es bastante complicada y, por lo tanto, la forma reducida es más adecuada para la predicción, pero no para la inferencia.

Suposiciones

En primer lugar, el rango de la matriz X de regresores exógenos debe ser igual a k , tanto en muestras finitas como en el límite como T → ∞ (este último requisito significa que en el límite la expresión debe converger a una matriz k×k no degenerada ) . También se supone que la matriz Γ no es degenerada.

En segundo lugar, se supone que los términos de error son serialmente independientes y están distribuidos de manera idéntica . Es decir, si la t- ésima fila de la matriz U se denota por u ( t ) , entonces la secuencia de vectores { u ( t ) } debe ser iid, con media cero y cierta matriz de covarianza Σ (que se desconoce). En particular, esto implica que E[ U ] = 0 y E[ U′U ] = T  Σ .

Por último, se requieren suposiciones para la identificación.

Identificación

Las condiciones de identificación requieren que el sistema de ecuaciones lineales tenga solución para los parámetros desconocidos.

Más específicamente, la condición de orden , una condición necesaria para la identificación, es que para cada ecuación k i + n i ≤ k , que puede expresarse como "el número de variables exógenas excluidas es mayor o igual al número de variables endógenas incluidas". .

La condición de rango , una condición más fuerte que es necesaria y suficiente, es que el rango de Π i 0 sea igual a n i , donde Π i 0 es una matriz ( k − k in i que se obtiene de Π tachando aquellos columnas que corresponden a las variables endógenas excluidas, y aquellas filas que corresponden a las variables exógenas incluidas.

Usar restricciones de ecuaciones cruzadas para lograr la identificación

En los modelos de ecuaciones simultáneas, el método más común para lograr la identificación es imponer restricciones de parámetros dentro de la ecuación. [6] Sin embargo, la identificación también es posible utilizando restricciones de ecuaciones cruzadas.

Para ilustrar cómo se pueden utilizar las restricciones de ecuaciones cruzadas para la identificación, considere el siguiente ejemplo de Wooldridge [6]

donde las z no están correlacionadas con las u y las y son variables endógenas . Sin mayores restricciones, no se identifica la primera ecuación porque no hay ninguna variable exógena excluida. La segunda ecuación simplemente se identifica si δ 13 ≠0 , lo cual se supone que es cierto durante el resto de la discusión.

Ahora imponemos la restricción de ecuación cruzada de δ 12 = δ 22 . Dado que se identifica la segunda ecuación, podemos tratar a δ 12 como conocido a efectos de identificación. Entonces, la primera ecuación queda:

Entonces, podemos usar ( z 1 , z 2 , z 3 ) como instrumentos para estimar los coeficientes en la ecuación anterior ya que hay una variable endógena ( y 2 ) y una variable exógena excluida ( z 2 ) en el lado derecho. Por lo tanto, las restricciones cruzadas en lugar de las restricciones dentro de la ecuación pueden lograr la identificación.

Estimacion

Mínimos cuadrados de dos etapas (2SLS)

El método de estimación más simple y común para el modelo de ecuaciones simultáneas es el llamado método de mínimos cuadrados en dos etapas , [7] desarrollado independientemente por Theil (1953) y Basmann (1957). [8] [9] Es una técnica de ecuación por ecuación, donde los regresores endógenos en el lado derecho de cada ecuación se instrumentan con los regresores X de todas las demás ecuaciones. El método se denomina “de dos etapas” porque realiza la estimación en dos pasos: [7]

Paso 1 : Haga una regresión Y −i en X y obtenga los valores predichos ;
Paso 2 : Estimar γ i , β i mediante la regresión de mínimos cuadrados ordinarios de y i on y Xi .

Si la i- ésima ecuación del modelo se escribe como

donde Z i es una matriz ( n i  + k i ) de regresores endógenos y exógenos en la i -ésima ecuación, y δ i es un vector ( n i  + k i ) dimensional de coeficientes de regresión, entonces el estimador 2SLS de δ i estará dado por [7]

donde P = X  ( X  ′ X ) −1 X  ′ es la matriz de proyección sobre el espacio lineal abarcado por los regresores exógenos X .

Mínimos cuadrados indirectos

Los mínimos cuadrados indirectos son un enfoque en econometría donde los coeficientes en un modelo de ecuaciones simultáneas se estiman a partir del modelo de forma reducida utilizando mínimos cuadrados ordinarios . [10] [11] Para ello, primero se transforma el sistema estructural de ecuaciones a su forma reducida. Una vez estimados los coeficientes, el modelo se devuelve a la forma estructural.

Máxima verosimilitud de información limitada (LIML)

El método de máxima verosimilitud de “información limitada” fue sugerido por MA Girshick en 1947, [12] y formalizado por TW Anderson y H. Rubin en 1949. [13] Se utiliza cuando uno está interesado en estimar una sola ecuación estructural a la vez. (de ahí su nombre de información limitada), digamos para observación i:

Las ecuaciones estructurales para las variables endógenas restantes Y −i no se especifican y se dan en su forma reducida:

La notación en este contexto es diferente a la del caso IV simple . Uno tiene:

La fórmula explícita para el LIML es: [14]

donde M = I − X  ( X  ′ X ) −1 X  ′ , y λ es la raíz característica más pequeña de la matriz:

donde, de manera similar, M i = I − X i  ( X iX i ) −1 X i .

En otras palabras, λ es la solución más pequeña del problema de valores propios generalizado , ver Theil (1971, p. 503):

Estimadores de clase K

El LIML es un caso especial de los estimadores de clase K: [15]

con:

Varios estimadores pertenecen a esta clase:

Mínimos cuadrados de tres etapas (3SLS)

El estimador de mínimos cuadrados de tres etapas fue introducido por Zellner y Theil (1962). [17] [18] Puede verse como un caso especial de GMM de múltiples ecuaciones donde el conjunto de variables instrumentales es común a todas las ecuaciones. [19] Si todos los regresores están de hecho predeterminados, entonces 3SLS se reduce a regresiones aparentemente no relacionadas (SUR). Por tanto, también puede verse como una combinación de mínimos cuadrados de dos etapas (2SLS) con SUR.

Aplicaciones en ciencias sociales

En todos los campos y disciplinas se aplican modelos de ecuaciones simultáneas a diversos fenómenos de observación. Estas ecuaciones se aplican cuando se supone que los fenómenos son recíprocamente causales. El ejemplo clásico es la oferta y la demanda en economía . En otras disciplinas hay ejemplos como las evaluaciones de candidatos y la identificación de partidos [20] o la opinión pública y la política social en las ciencias políticas ; [21] [22] inversión en carreteras y demanda de viajes en geografía; [23] y el nivel educativo y el ingreso a la paternidad en sociología o demografía . [24] El modelo de ecuación simultánea requiere una teoría de causalidad recíproca que incluya características especiales si los efectos causales deben estimarse como retroalimentación simultánea en lugar de "bloques" unilaterales de una ecuación donde un investigador está interesado en el efecto causal de X sobre Y mientras se mantiene constante el efecto causal de Y sobre X, o cuando el investigador sabe la cantidad exacta de tiempo que tarda en producirse cada efecto causal, es decir, la duración de los desfases causales. En lugar de efectos rezagados, la retroalimentación simultánea significa estimar el impacto simultáneo y perpetuo de X e Y entre sí. Esto requiere una teoría de que los efectos causales sean simultáneos en el tiempo, o tan complejos que parezcan comportarse simultáneamente; un ejemplo común son los estados de ánimo de los compañeros de cuarto. [25] Para estimar modelos de retroalimentación simultánea también es necesaria una teoría del equilibrio: que X e Y se encuentren en estados relativamente estables o sean parte de un sistema (sociedad, mercado, aula) que se encuentre en un estado relativamente estable. [26]

Ver también

Referencias

  1. ^ Martín, Vance; Hurra, Stan; Harris, David (2013). Modelización econométrica con series temporales . Prensa de la Universidad de Cambridge. pag. 159.ISBN _ 978-0-521-19660-4.
  2. ^ Maddala, GS; Lahiri, Kajal (2009). Introducción a la econometría (Cuarta ed.). Wiley. págs. 355–357. ISBN 978-0-470-01512-4.
  3. ^ Quandt, Richard E. (1983). "Problemas y métodos computacionales". En Griliches, Z.; Intriligador, MD (eds.). Manual de econometría . vol. I. Holanda Septentrional. págs. 699–764. ISBN 0-444-86185-8.
  4. ^ Cristo, Carl F. (1994). "Contribuciones de la Comisión Cowles a la econometría en Chicago, 1939-1955". Revista de Literatura Económica . 32 (1): 30–59. JSTOR  2728422.
  5. ^ Johnston, J. (1971). "Métodos de ecuaciones simultáneas: estimación". Métodos econométricos (Segunda ed.). Nueva York: McGraw-Hill. págs. 376–423. ISBN 0-07-032679-7.
  6. ^ ab Wooldridge, JM, Análisis econométrico de datos de panel y sección transversal, MIT Press, Cambridge, Mass.
  7. ^ abc Greene, William H. (2002). Análisis econométrico (5ª ed.). Prentice Hall. págs. 398–99. ISBN 0-13-066189-9.
  8. ^ Basmann, RL (1957). "Un método clásico generalizado de estimación lineal de coeficientes en una ecuación estructural". Econométrica . 25 (1): 77–83. doi :10.2307/1907743. JSTOR  1907743.
  9. ^ Theil, Henri (1971). Principios de econometría . Nueva York: John Wiley.
  10. ^ Parque, SB. (1974) "Sobre la estimación de mínimos cuadrados indirectos de un sistema de ecuaciones simultáneas", The Canadian Journal of Statistics / La Revue Canadienne de Statistique , 2 (1), 75–82 JSTOR  3314964
  11. ^ Vajda, S.; Valko, P.; Godfrey, KR (1987). "Métodos de mínimos cuadrados directos e indirectos en la estimación de parámetros de tiempo continuo". Automática . 23 (6): 707–718. doi :10.1016/0005-1098(87)90027-6.
  12. ^ Primera solicitud de Girshick, MA; Haavelmo, Trygve (1947). "Análisis estadístico de la demanda de alimentos: ejemplos de estimación simultánea de ecuaciones estructurales". Econométrica . 15 (2): 79-110. doi :10.2307/1907066. JSTOR  1907066.
  13. ^ Anderson, TW; Rubin, H. (1949). "Estimador de los parámetros de una sola ecuación en un sistema completo de ecuaciones estocásticas". Anales de estadística matemática . 20 (1): 46–63. doi : 10.1214/aoms/1177730090 . JSTOR  2236803.
  14. ^ Amemiya, Takeshi (1985). Econometría avanzada . Cambridge, Massachusetts: Prensa de la Universidad de Harvard. pag. 235.ISBN _ 0-674-00560-0.
  15. ^ ab Davidson, Russell; MacKinnon, James G. (1993). Estimación e inferencia en econometría . Prensa de la Universidad de Oxford. pag. 649.ISBN _ 0-19-506011-3.
  16. ^ Más completo, Wayne (1977). "Algunas propiedades de una modificación del estimador de información limitada". Econométrica . 45 (4): 939–953. doi :10.2307/1912683. JSTOR  1912683.
  17. ^ Zellner, Arnold ; Theil, Henri (1962). "Mínimo cuadrado de tres etapas: estimación simultánea de ecuaciones simultáneas". Econométrica . 30 (1): 54–78. doi :10.2307/1911287. JSTOR  1911287.
  18. ^ Kmenta, enero (1986). "Métodos de estimación del sistema". Elementos de econometría (Segunda ed.). Nueva York: Macmillan. págs. 695–701. ISBN 9780023650703.
  19. ^ Hayashi, Fumio (2000). "GMM de ecuaciones múltiples". Econometría . Prensa de la Universidad de Princeton. págs. 276-279. ISBN 1400823838.
  20. ^ Página, Benjamín I.; Jones, Calvin C. (1 de diciembre de 1979). "Efectos recíprocos de las preferencias políticas, las lealtades partidistas y el voto". Revista estadounidense de ciencias políticas . 73 (4): 1071–1089. doi :10.2307/1953990. ISSN  0003-0554. JSTOR  1953990. S2CID  144984371.
  21. ^ Wlezien, Christopher (1 de enero de 1995). "El público como termostato: dinámica de preferencias de gasto". Revista Estadounidense de Ciencias Políticas . 39 (4): 981–1000. doi :10.2307/2111666. JSTOR  2111666.
  22. ^ Breznau, Nate (1 de julio de 2016). "Rendimientos positivos y equilibrio: retroalimentación simultánea entre la opinión pública y la política social". Revista de estudios políticos . 45 (4): 583–612. doi :10.1111/psj.12171. ISSN  1541-0072.
  23. ^ Xie, F.; Levinson, D. (1 de mayo de 2010). "Cómo los tranvías dieron forma a la suburbanización: un análisis de causalidad de Granger sobre el uso del suelo y el tránsito en las ciudades gemelas". Revista de Geografía Económica . 10 (3): 453–470. doi :10.1093/jeg/lbp031. hdl : 11299/179996 . ISSN  1468-2702.
  24. ^ Marini, Margaret Mooney (1 de enero de 1984). "El nivel educativo de las mujeres y el momento de su entrada en la paternidad". Revista sociológica estadounidense . 49 (4): 491–511. doi :10.2307/2095464. JSTOR  2095464.
  25. ^ Wong, Chi-Sum; Ley, Kenneth S. (1 de enero de 1999). "Prueba de relaciones recíprocas mediante modelos de ecuaciones estructurales no recursivos utilizando datos transversales". Métodos de investigación organizacional . 2 (1): 69–87. doi :10.1177/109442819921005. ISSN  1094-4281. S2CID  122284566.
  26. ^ 2013. "Dinámica de flecha inversa: bucles de retroalimentación y medición formativa". En Modelado de ecuaciones estructurales: un segundo curso , editado por Gregory R. Hancock y Ralph O. Mueller, 2ª ed., 41–79. Charlotte, Carolina del Norte: Publicaciones de la era de la información

Otras lecturas

enlaces externos