stringtranslate.com

Modelo de efectos fijos

En estadística , un modelo de efectos fijos es un modelo estadístico en el que los parámetros del modelo son cantidades fijas o no aleatorias. Esto contrasta con los modelos de efectos aleatorios y los modelos mixtos en los que todos o algunos de los parámetros del modelo son variables aleatorias. En muchas aplicaciones, incluidas la econometría [1] y la bioestadística [2] [3] [4] [5] [6], un modelo de efectos fijos se refiere a un modelo de regresión en el que las medias del grupo son fijas (no aleatorias) a diferencia de un modelo de efectos aleatorios en el que las medias del grupo son una muestra aleatoria de una población. [7] [6] Generalmente, los datos se pueden agrupar de acuerdo con varios factores observados. Las medias del grupo se pueden modelar como efectos fijos o aleatorios para cada agrupamiento. En un modelo de efectos fijos, cada media del grupo es una cantidad fija específica del grupo.

En los datos de panel, en los que existen observaciones longitudinales para el mismo sujeto, los efectos fijos representan las medias específicas del sujeto. En el análisis de datos de panel, el término estimador de efectos fijos (también conocido como estimador intra ) se utiliza para referirse a un estimador de los coeficientes del modelo de regresión, incluidos esos efectos fijos (una intersección invariante en el tiempo para cada sujeto).

Descripción cualitativa

Estos modelos ayudan a controlar el sesgo de variable omitida debido a la heterogeneidad no observada cuando esta heterogeneidad es constante a lo largo del tiempo. Esta heterogeneidad se puede eliminar de los datos mediante la diferenciación, por ejemplo, restando el promedio a nivel de grupo a lo largo del tiempo o tomando una primera diferencia que eliminará cualquier componente invariante en el tiempo del modelo.

Existen dos supuestos comunes sobre el efecto específico individual: el supuesto de efectos aleatorios y el supuesto de efectos fijos. El supuesto de efectos aleatorios es que los efectos específicos individuales no están correlacionados con las variables independientes. El supuesto de efectos fijos es que los efectos específicos individuales están correlacionados con las variables independientes. Si el supuesto de efectos aleatorios se cumple, el estimador de efectos aleatorios es más eficiente que el estimador de efectos fijos. Sin embargo, si este supuesto no se cumple, el estimador de efectos aleatorios no es consistente . La prueba de Durbin-Wu-Hausman se utiliza a menudo para discriminar entre los modelos de efectos fijos y aleatorios. [8] [9]

Modelo formal y supuestos

Consideremos el modelo lineal de efectos no observados para observaciones y períodos de tiempo:

para y

Dónde:

A diferencia de , no se puede observar directamente.

A diferencia del modelo de efectos aleatorios, donde lo no observado es independiente de para todos los , el modelo de efectos fijos (EF) permite correlacionarse con la matriz regresora . Aún se requiere una exogeneidad estricta con respecto al término de error idiosincrásico .

Estimación estadística

Estimador de efectos fijos

Dado que no es observable, no se puede controlar directamente . El modelo de elementos finitos elimina las variables desmesuradas mediante la transformación interna :

donde , , y .

Dado que es constante, y por lo tanto el efecto se elimina. El estimador de EF se obtiene entonces mediante una regresión MCO de en .

Existen al menos tres alternativas a la transformación interna con variaciones.

Una de ellas consiste en añadir una variable ficticia para cada individuo (omitiendo el primer individuo debido a la multicolinealidad ). Esto es numéricamente, pero no computacionalmente, equivalente al modelo de efectos fijos y solo funciona si la suma del número de series y el número de parámetros globales es menor que el número de observaciones. [10] El enfoque de la variable ficticia es particularmente exigente con respecto al uso de la memoria de la computadora y no se recomienda para problemas más grandes que la RAM disponible y la compilación del programa aplicado pueden acomodar.

La segunda alternativa es utilizar el enfoque de reiteraciones consecutivas para estimaciones locales y globales. [11] Este enfoque es muy adecuado para sistemas con poca memoria en los que es mucho más eficiente computacionalmente que el enfoque de variable ficticia.

El tercer enfoque es una estimación anidada, en la que la estimación local de series individuales se programa como parte de la definición del modelo. [12] Este enfoque es el más eficiente en términos computacionales y de memoria, pero requiere habilidades de programación competentes y acceso al código de programación del modelo; aunque se puede programar incluso en SAS. [13] [14]

Finalmente, cada una de las alternativas anteriores se puede mejorar si la estimación específica de la serie es lineal (dentro de un modelo no lineal), en cuyo caso la solución lineal directa para series individuales se puede programar como parte de la definición del modelo no lineal. [15]

Estimador de primera diferencia

Una alternativa a la transformación interna es la transformación de primera diferencia , que produce un estimador diferente. Para :

El estimador FD se obtiene entonces mediante una regresión MCO de en .

Cuando , los estimadores de primera diferencia y de efectos fijos son numéricamente equivalentes. Para , no lo son. Si los términos de error son homocedásticos sin correlación serial , el estimador de efectos fijos es más eficiente que el estimador de primera diferencia. Sin embargo, si sigue un paseo aleatorio , el estimador de primera diferencia es más eficiente. [16]

Igualdad de efectos fijos y estimadores de primera diferencia cuando T=2

Para el caso especial de dos períodos ( ), el estimador de efectos fijos (EF) y el estimador de primera diferencia (FD) son numéricamente equivalentes. Esto se debe a que el estimador de EF efectivamente "duplica el conjunto de datos" utilizado en el estimador de FD. Para ver esto, establezca que el estimador de efectos fijos es:

Dado que cada uno puede reescribirse como , reescribiremos la línea como:

Método Chamberlain

El método de Gary Chamberlain, una generalización del estimador intra, reemplaza el método por una proyección lineal sobre las variables explicativas. La proyección lineal se escribe así:

Esto da como resultado la siguiente ecuación:

que puede estimarse mediante la estimación de la distancia mínima . [17]

Método de Hausman-Taylor

Es necesario tener más de un regresor variante en el tiempo ( ) y un regresor invariante en el tiempo ( ) y al menos uno y uno que no estén correlacionados con .

Particionar las variables y de tal manera que donde y no estén correlacionados con . Necesita .

La estimación mediante MCO utilizando y como instrumentos produce una estimación consistente.

Generalización con incertidumbre de entrada

Cuando existe incertidumbre de entrada para los datos , entonces se debe minimizar el valor, en lugar de la suma de los residuos al cuadrado. [18] Esto se puede lograr directamente a partir de reglas de sustitución:

,

Luego, los valores y las desviaciones estándar para y se pueden determinar mediante el análisis de mínimos cuadrados ordinarios clásico y la matriz de varianza-covarianza .

Úselo para probar la consistencia

Los estimadores de efectos aleatorios pueden ser inconsistentes en ocasiones en el límite de series de tiempo largas, si los efectos aleatorios están mal especificados (es decir, el modelo elegido para los efectos aleatorios es incorrecto). Sin embargo, el modelo de efectos fijos puede ser consistente en algunas situaciones. Por ejemplo, si la serie de tiempo que se está modelando no es estacionaria, los modelos de efectos aleatorios que asumen estacionariedad pueden no ser consistentes en el límite de series largas. Un ejemplo de esto es si la serie de tiempo tiene una tendencia ascendente. Entonces, a medida que la serie se hace más larga, el modelo revisa las estimaciones de la media de períodos anteriores hacia arriba, dando predicciones cada vez más sesgadas de los coeficientes. Sin embargo, un modelo con efectos de tiempo fijos no agrupa información a lo largo del tiempo y, como resultado, las estimaciones anteriores no se verán afectadas.

En situaciones como estas, en las que se sabe que el modelo de efectos fijos es consistente, se puede utilizar la prueba de Durbin-Wu-Hausman para comprobar si el modelo de efectos aleatorios elegido es consistente. Si es cierto, tanto y son consistentes, pero solo es eficiente. Si es cierto , no se puede garantizar la consistencia de .

Véase también

Notas

  1. ^ Greene, WH, 2011. Análisis econométrico , 7.ª ed., Prentice Hall
  2. ^ Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Análisis de datos longitudinales (2ª ed.). Prensa de la Universidad de Oxford. págs. 169-171. ISBN 0-19-852484-6.
  3. ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Análisis longitudinal aplicado . Hoboken: John Wiley & Sons. págs. 326–328. ISBN 0-471-21487-6.
  4. ^ Laird, Nan M.; Ware, James H. (1982). "Modelos de efectos aleatorios para datos longitudinales". Biometrics . 38 (4): 963–974. doi :10.2307/2529876. JSTOR  2529876.
  5. ^ Gardiner, Joseph C.; Luo, Zhehui; Roman, Lee Anne (2009). "Efectos fijos, efectos aleatorios y GEE: ¿Cuáles son las diferencias?". Estadísticas en Medicina . 28 (2): 221–239. doi :10.1002/sim.3478. PMID  19012297. S2CID  16277040.
  6. ^ ab Gomes, Dylan GE (20 de enero de 2022). "¿Debo utilizar efectos fijos o efectos aleatorios cuando tengo menos de cinco niveles de un factor de agrupamiento en un modelo de efectos mixtos?". PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID  35116198. 
  7. ^ Ramsey, F., Schafer, D., 2002. El detective estadístico: un curso sobre métodos de análisis de datos , 2.ª ed. Duxbury Press
  8. ^ Cameron, A. Colin; Trivedi, Pravin K. (2005). Microeconometría: métodos y aplicaciones. Cambridge University Press. págs. 717-19. ISBN 9780521848053.
  9. ^ Nerlove, Marc (2005). Ensayos sobre econometría de datos de panel. Cambridge University Press. pp. 36–39. ISBN 9780521022460.
  10. ^ García, Oscar. (1983). "Un modelo de ecuación diferencial estocástica para el crecimiento en altura de las masas forestales". Biometrics . 39 (4): 1059–1072. doi :10.2307/2531339. JSTOR  2531339.
  11. ^ Tait, David; Cieszewski, Chris J.; Bella, Imre E. (1986). "Dinámica de la población de pino contorta". Can. J. For. Res . 18 (10): 1255–1260. doi :10.1139/x88-193.
  12. ^ Strub, Mike; Cieszewski, Chris J. (2006). "Propiedades de invariancia de la edad base de dos técnicas para estimar los parámetros de los modelos de índice de sitio". Forest Science . 52 (2): 182–186.
  13. ^ Strub, Mike; Cieszewski, Chris J. (2003). Burkhart, HA (ed.). Ajuste de parámetros de índice de sitio global cuando el índice de sitio de la parcela o del árbol se trata como un parámetro de molestia local . Actas del Simposio sobre Estadística y Tecnología de la Información en Silvicultura; 8 al 12 de septiembre de 2002; Blacksburg, Virginia: Instituto Politécnico y Universidad Estatal de Virginia. págs. 97-107.
  14. ^ Cieszewski, Chris J.; Harrison, Mike; Martin, Stacey W. (2000). "Métodos prácticos para estimar parámetros no sesgados en modelos de crecimiento y rendimiento autorreferenciales" (PDF) . Informe técnico del PMRC . 2000 (7): 12.
  15. ^ Schnute, Jon; McKinnell, Skip (1984). "Un enfoque biológicamente significativo para el análisis de la superficie de respuesta". Can. J. Fish. Aquat. Sci . 41 (6): 936–953. doi :10.1139/f84-108.
  16. ^ Wooldridge, Jeffrey M. (2001). Análisis econométrico de datos de sección transversal y de panel . MIT Press. págs. 279–291. ISBN 978-0-262-23219-7.
  17. ^ Chamberlain, Gary (1984). Capítulo 22 Datos de panel . Manual de econometría. Vol. 2. págs. 1247–1318. doi :10.1016/S1573-4412(84)02014-6. ISBN 9780444861863. ISSN  1573-4412.
  18. ^ Ren, Bin; Dong, Ruobing; Esposito, Thomas M.; Pueyo, Laurent; Debes, John H.; Poteet, Charles A.; Choquet, Élodie; Benisty, Myriam; Chiang, Eugene; Grady, Carol A.; Hines, Dean C.; Schneider, Glenn; Soummer, Rémi (2018). "Una década de imágenes del disco MWC 758: ¿Dónde están los planetas que impulsan los brazos espirales?". The Astrophysical Journal Letters . 857 (1): L9. arXiv : 1803.06776 . Código Bibliográfico :2018ApJ...857L...9R. doi : 10.3847/2041-8213/aab7f5 . S2CID  59427417.

Referencias

Enlaces externos