stringtranslate.com

Panel de datos

En estadística y econometría , los datos de panel y los datos longitudinales [1] [2] son ​​datos multidimensionales que implican mediciones a lo largo del tiempo. Los datos de panel son un subconjunto de datos longitudinales donde las observaciones son para los mismos sujetos cada vez.

Las series temporales y los datos transversales pueden considerarse como casos especiales de datos de panel que se encuentran en una sola dimensión (un miembro del panel o individuo para los primeros, un punto temporal para los segundos). Una búsqueda bibliográfica suele incluir datos de series temporales, transversales o de panel. Los datos de panel cruzado (CPD) son una fuente de información innovadora pero subestimada en las ciencias matemáticas y estadísticas. El DPC se destaca de otros métodos de investigación porque ilustra vívidamente cómo las variables independientes y dependientes pueden cambiar entre países. Esta recopilación de datos de panel permite a los investigadores examinar la conexión entre variables en varias secciones transversales y períodos de tiempo y analizar los resultados de acciones políticas en otras naciones. [3]

Un estudio que utiliza datos de panel se denomina estudio longitudinal o estudio de panel.

Ejemplo

En el ejemplo anterior del procedimiento de permutación de respuestas múltiples ( MRPP ), se muestran dos conjuntos de datos con una estructura de panel y el objetivo es probar si hay una diferencia significativa entre las personas en los datos de la muestra. Se recopilan características individuales (ingresos, edad, sexo) para diferentes personas y diferentes años. En el primer conjunto de datos, se observa a dos personas (1, 2) cada año durante tres años (2016, 2017, 2018). En el segundo conjunto de datos, se observa a tres personas (1, 2, 3) dos veces (persona 1), tres veces (persona 2) y una vez (persona 3), respectivamente, durante tres años (2016, 2017, 2018). ; en particular, la persona 1 no se observa en el año 2018 y la persona 3 no se observa en 2016 o 2018.

Un panel equilibrado (por ejemplo, el primer conjunto de datos anterior) es un conjunto de datos en el que cada miembro del panel (es decir, persona) es observado cada año. En consecuencia, si un panel equilibrado contiene miembros y períodos del panel, el número de observaciones ( ) en el conjunto de datos es necesariamente .

Un panel desequilibrado (por ejemplo, el segundo conjunto de datos anterior) es un conjunto de datos en el que al menos un miembro del panel no es observado en cada período. Por lo tanto, si un panel desequilibrado contiene miembros del panel y períodos, entonces se cumple la siguiente desigualdad estricta para el número de observaciones ( ) en el conjunto de datos: .

Ambos conjuntos de datos anteriores están estructurados en formato largo , que es donde una fila contiene una observación por vez. Otra forma de estructurar los datos de panel sería el formato amplio , donde una fila representa una unidad de observación para todos los momentos en el tiempo (por ejemplo, el formato amplio tendría solo dos (primer ejemplo) o tres (segundo ejemplo) filas de datos con datos adicionales. columnas para cada variable que varía en el tiempo (ingresos, edad).

Análisis

Un panel tiene la forma

donde es la dimensión individual y es la dimensión temporal. Un modelo de regresión de datos de panel general se escribe como . Se pueden hacer diferentes supuestos sobre la estructura precisa de este modelo general. Dos modelos importantes son el modelo de efectos fijos y el modelo de efectos aleatorios .

Considere un modelo de datos de panel genérico:

son efectos específicos de cada individuo que no varían en el tiempo (por ejemplo, en un panel de países esto podría incluir la geografía, el clima, etc.) que se fijan en el tiempo, mientras que es un componente aleatorio que varía en el tiempo.

Si no se observa y se correlaciona con al menos una de las variables independientes, provocará un sesgo de variable omitida en una regresión estándar de MCO . Sin embargo, se pueden utilizar métodos de datos de panel, como el estimador de efectos fijos o, alternativamente, el estimador de primeras diferencias para controlarlo.

Si no está correlacionado con ninguna de las variables independientes, se pueden utilizar métodos de regresión lineal de mínimos cuadrados ordinarios para producir estimaciones insesgadas y consistentes de los parámetros de regresión. Sin embargo, debido a que se fija en el tiempo, inducirá una correlación serial en el término de error de la regresión. Esto significa que se dispone de técnicas de estimación más eficientes. Los efectos aleatorios son uno de esos métodos: es un caso especial de mínimos cuadrados generalizados factibles que controla la estructura de la correlación serial inducida por .

Datos del panel dinámico

Los datos de panel dinámico describen el caso en el que se utiliza un rezago de la variable dependiente como regresor:

La presencia de la variable dependiente rezagada viola la exogeneidad estricta, es decir, puede ocurrir endogeneidad . Tanto el estimador de efectos fijos como el estimador de primeras diferencias se basan en el supuesto de exogeneidad estricta. Por lo tanto, si se cree que está correlacionado con una de las variables independientes, se debe utilizar una técnica de estimación alternativa. En esta situación se utilizan comúnmente variables instrumentales o técnicas GMM, como el estimador de Arellano-Bond . Al estimar esto debemos tener la información adecuada sobre las variables instrumentales.

Conjuntos de datos que tienen un diseño de panel.

Conjuntos de datos que tienen un diseño de panel multidimensional.

Notas

  1. ^ Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Análisis de datos longitudinales (2ª ed.). Prensa de la Universidad de Oxford. pag. 2.ISBN​ 0-19-852484-6.
  2. ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Mercancías, James H. (2004). Análisis Longitudinal Aplicado . Hoboken: John Wiley e hijos. pag. 2.ISBN 0-471-21487-6.
  3. ^ Zaman, Khalid (24 de enero de 2023). "Una nota sobre las técnicas de datos entre paneles". Últimos avances en econometría . 1 (1): 1–7. doi :10.5281/zenodo.7565625.

Referencias

enlaces externos