El análisis de panel ( datos ) es un método estadístico, ampliamente utilizado en ciencias sociales , epidemiología y econometría para analizar datos de panel bidimensionales (típicamente transversales y longitudinales) . [1] Los datos generalmente se recopilan a lo largo del tiempo y sobre los mismos individuos y luego se ejecuta una regresión sobre estas dos dimensiones. El análisis multidimensional es un método econométrico en el que los datos se recopilan en más de dos dimensiones (típicamente, tiempo, individuos y alguna tercera dimensión). [2]
Un modelo de regresión de datos de panel común se ve así : , donde es la variable dependiente , es la variable independiente , y son coeficientes , y son índices para individuos y tiempo. El error es muy importante en este análisis. Las suposiciones sobre el término de error determinan si hablamos de efectos fijos o efectos aleatorios. En un modelo de efectos fijos, se supone que varía de forma no estocástica a lo largo de o haciendo que el modelo de efectos fijos sea análogo a un modelo de variable ficticia en una dimensión. En un modelo de efectos aleatorios, se supone que varía de forma estocástica a lo largo de o requiriendo un tratamiento especial de la matriz de varianza del error. [3]
El análisis de datos de panel tiene tres enfoques más o menos independientes:
La selección entre estos métodos depende del objetivo del análisis y de los problemas relacionados con la exogeneidad de las variables explicativas.
Supuesto clave:
No hay atributos únicos de individuos dentro del conjunto de medición, ni efectos universales a través del tiempo.
Supuesto clave:
Existen atributos únicos de los individuos que no varían con el tiempo. Es decir, los atributos únicos de un individuo determinado son invariantes en el tiempo. Estos atributos pueden o no estar correlacionados con las variables dependientes individuales y i . Para comprobar si se necesitan efectos fijos, en lugar de efectos aleatorios, se puede utilizar la prueba de Durbin-Wu-Hausman .
Supuesto clave:
existen atributos únicos y constantes en el tiempo de los individuos que no están correlacionados con los regresores individuales. Los MCO agrupados [ aclaración necesaria ] se pueden utilizar para derivar estimaciones imparciales y consistentes de los parámetros incluso cuando existen atributos constantes en el tiempo, pero los efectos aleatorios serán más eficientes .
El modelo de efectos aleatorios es una técnica factible de mínimos cuadrados generalizados que es asintóticamente más eficiente que el modelo MCO agrupado cuando están presentes atributos de constantes de tiempo. Los efectos aleatorios se ajustan a la correlación serial que es inducida por atributos de constantes de tiempo no observados.
En los modelos estándar de efectos aleatorios (RE) y de efectos fijos (FE), se supone que las variables independientes no están correlacionadas con los términos de error. Siempre que se disponga de instrumentos válidos, los métodos de RE y FE se extienden al caso en que se permite que algunas de las variables explicativas sean endógenas. Al igual que en el contexto exógeno, el modelo de RE con variables instrumentales (REIV) requiere supuestos más estrictos que el modelo de FE con variables instrumentales (FEIV), pero tiende a ser más eficiente en condiciones apropiadas. [4]
Para fijar ideas, considere el siguiente modelo:
donde es un efecto invariante en el tiempo específico de la unidad no observado (llamémoslo efecto no observado) y puede correlacionarse con para s posiblemente diferente de t . Supongamos que existe un conjunto de instrumentos válidos .
En el contexto de REIV, los supuestos clave incluyen que no está correlacionado con ni con . De hecho, para que el estimador REIV sea eficiente, son necesarias condiciones más fuertes que la falta de correlación entre los instrumentos y el efecto no observado.
Por otra parte, el estimador FEIV solo requiere que los instrumentos sean exógenos con términos de error después del condicionamiento sobre el efecto no observado , es decir, [4] La condición FEIV permite una correlación arbitraria entre los instrumentos y el efecto no observado. Sin embargo, esta generalidad no es gratuita: no se permiten variables explicativas e instrumentales invariantes en el tiempo. Como en el método EF habitual, el estimador utiliza variables desmesuradas en el tiempo para eliminar el efecto no observado. Por lo tanto, el estimador FEIV sería de uso limitado si las variables de interés incluyen las invariantes en el tiempo.
El análisis anterior es paralelo al caso exógeno de los modelos RE y FE. En el caso exógeno, RE supone la falta de correlación entre las variables explicativas y el efecto no observado, y FE permite una correlación arbitraria entre ambos. De manera similar al caso estándar, REIV tiende a ser más eficiente que FEIV siempre que se cumplan los supuestos apropiados. [4]
A diferencia del modelo de datos de panel estándar, un modelo de panel dinámico también incluye valores rezagados de la variable dependiente como regresores. Por ejemplo, incluir un rezago de la variable dependiente genera:
En este contexto, se violan los supuestos de los modelos de efectos fijos y efectos aleatorios. En su lugar, los profesionales utilizan una técnica como el estimador de Arellano-Bond .