Los modelos multinivel (también conocidos como modelos lineales jerárquicos , modelos lineales de efectos mixtos , modelos mixtos , modelos de datos anidados , modelos de coeficientes aleatorios , modelos de efectos aleatorios , modelos de parámetros aleatorios o diseños de parcela dividida ) son modelos estadísticos de parámetros que varían en más de un nivel. [1] Un ejemplo podría ser un modelo de rendimiento de los estudiantes que contiene medidas para estudiantes individuales, así como medidas para las aulas dentro de las cuales se agrupan los estudiantes. Estos modelos pueden verse como generalizaciones de modelos lineales (en particular, regresión lineal ), aunque también pueden extenderse a modelos no lineales. Estos modelos se volvieron mucho más populares después de que se dispusiera de suficiente potencia informática y software. [1]
Los modelos multinivel son particularmente apropiados para diseños de investigación donde los datos de los participantes están organizados en más de un nivel (es decir, datos anidados ). [2] Las unidades de análisis son generalmente individuos (en un nivel inferior) que están anidados dentro de unidades contextuales/agregadas (en un nivel superior). [3] Si bien el nivel más bajo de datos en los modelos multinivel suele ser un individuo, también se pueden examinar mediciones repetidas de individuos. [2] [4] Como tal, los modelos multinivel proporcionan un tipo alternativo de análisis para el análisis univariado o multivariado de medidas repetidas . Se pueden examinar las diferencias individuales en las curvas de crecimiento . [2] Además, los modelos multinivel se pueden utilizar como una alternativa a ANCOVA , donde las puntuaciones en la variable dependiente se ajustan para las covariables (por ejemplo, las diferencias individuales) antes de probar las diferencias de tratamiento. [5] Los modelos multinivel pueden analizar estos experimentos sin los supuestos de homogeneidad de pendientes de regresión que requiere ANCOVA. [2]
Los modelos multinivel se pueden utilizar en datos con muchos niveles, aunque los modelos de dos niveles son los más comunes y el resto de este artículo trata sólo de ellos. La variable dependiente debe examinarse en el nivel más bajo de análisis. [1]
Cuando hay una sola variable independiente de nivel 1, el modelo de nivel 1 es
.
En el nivel 1, tanto las intersecciones como las pendientes en los grupos pueden ser fijas (lo que significa que todos los grupos tienen los mismos valores, aunque en el mundo real esto sería una ocurrencia rara), no variables aleatoriamente (lo que significa que las intersecciones y/o pendientes son predecibles a partir de una variable independiente en el nivel 2), o variables aleatoriamente (lo que significa que las intersecciones y/o pendientes son diferentes en los diferentes grupos, y que cada uno tiene su propia media y varianza generales). [2] [4]
Cuando hay múltiples variables independientes de nivel 1, el modelo se puede expandir sustituyendo vectores y matrices en la ecuación.
Cuando la relación entre la respuesta y el predictor no puede describirse mediante una relación lineal, se puede encontrar una relación funcional no lineal entre la respuesta y el predictor y extender el modelo a un modelo de efectos mixtos no lineal . Por ejemplo, cuando la respuesta es la trayectoria de infección acumulada del país -ésimo y representa los puntos temporales -ésimos, entonces el par ordenado para cada país puede mostrar una forma similar a la de una función logística . [6] [7]
Las variables dependientes son las intersecciones y las pendientes de las variables independientes del Nivel 1 en los grupos del Nivel 2.
Antes de realizar un análisis de modelos multinivel, el investigador debe decidir varios aspectos, incluidos los predictores que se incluirán en el análisis, si es que se incluyen. En segundo lugar, el investigador debe decidir si los valores de los parámetros (es decir, los elementos que se estimarán) serán fijos o aleatorios. [2] [5] [4] Los parámetros fijos se componen de una constante para todos los grupos, mientras que un parámetro aleatorio tiene un valor diferente para cada uno de los grupos. [4] Además, el investigador debe decidir si empleará una estimación de máxima verosimilitud o un tipo de estimación de máxima verosimilitud restringida. [2]
Un modelo de intersecciones aleatorias es un modelo en el que se permite que las intersecciones varíen y, por lo tanto, las puntuaciones de la variable dependiente para cada observación individual se predicen por la intersección que varía entre los grupos. [5] [8] [4] Este modelo supone que las pendientes son fijas (las mismas en diferentes contextos). Además, este modelo proporciona información sobre las correlaciones intraclase , que son útiles para determinar si se requieren modelos multinivel en primer lugar. [2]
Un modelo de pendientes aleatorias es un modelo en el que se permite que las pendientes varíen según una matriz de correlación y, por lo tanto, las pendientes son diferentes en función de las variables de agrupación, como el tiempo o los individuos. Este modelo supone que las intersecciones son fijas (las mismas en diferentes contextos). [5]
Un modelo que incluye tanto puntos de corte aleatorios como pendientes aleatorias es probablemente el tipo de modelo más realista, aunque también es el más complejo. En este modelo, tanto los puntos de corte como las pendientes pueden variar entre grupos, lo que significa que son diferentes en distintos contextos. [5]
Para realizar un análisis de modelos multinivel, se comenzaría con coeficientes fijos (pendientes e intersecciones). Se permitiría que un aspecto varíe a la vez (es decir, se cambiaría) y se compararía con el modelo anterior para evaluar un mejor ajuste del modelo. [1] Hay tres preguntas diferentes que un investigador se haría al evaluar un modelo. Primero, ¿es un buen modelo? Segundo, ¿es mejor un modelo más complejo? Tercero, ¿qué contribución hacen los predictores individuales al modelo?
Para evaluar los modelos, se examinarían diferentes estadísticas de ajuste del modelo. [2] Una de estas estadísticas es la prueba de razón de verosimilitud de chi-cuadrado , que evalúa la diferencia entre modelos. La prueba de razón de verosimilitud se puede emplear para la construcción de modelos en general, para examinar lo que sucede cuando se permite que varíen los efectos en un modelo y cuando se prueba una variable categórica codificada ficticiamente como un efecto único. [2] Sin embargo, la prueba solo se puede utilizar cuando los modelos están anidados (lo que significa que un modelo más complejo incluye todos los efectos de un modelo más simple). Al probar modelos no anidados, se pueden hacer comparaciones entre modelos utilizando el criterio de información de Akaike (AIC) o el criterio de información bayesiano (BIC), entre otros. [1] [2] [5] Véase más información Selección de modelos .
Los modelos multinivel tienen los mismos supuestos que otros modelos lineales generales importantes (por ejemplo, ANOVA , regresión ), pero algunos de los supuestos se modifican según la naturaleza jerárquica del diseño (es decir, datos anidados).
El supuesto de linealidad establece que existe una relación rectilínea (en línea recta, en oposición a una relación no lineal o en forma de U) entre las variables. [9] Sin embargo, el modelo se puede extender a relaciones no lineales. [10] En particular, cuando la parte media de la ecuación de regresión de nivel 1 se reemplaza con una función paramétrica no lineal, entonces dicho marco de modelo se denomina ampliamente modelo de efectos mixtos no lineal . [7]
El supuesto de normalidad establece que los términos de error en cada nivel del modelo se distribuyen normalmente. [9] [ disputado – discutir ] Sin embargo, la mayoría del software estadístico permite especificar diferentes distribuciones para los términos de varianza, como Poisson, binomial, logística. El enfoque de modelado multinivel se puede utilizar para todas las formas de modelos lineales generalizados.
El supuesto de homocedasticidad , también conocido como homogeneidad de varianza, supone la igualdad de varianzas poblacionales. [9] Sin embargo, se pueden especificar diferentes matrices de correlación de varianza para tener esto en cuenta, y se puede modelar la heterogeneidad de la varianza.
La independencia es un supuesto de los modelos lineales generales, que establece que los casos son muestras aleatorias de la población y que las puntuaciones de la variable dependiente son independientes entre sí. [9] Uno de los principales propósitos de los modelos multinivel es tratar los casos en los que se viola el supuesto de independencia; sin embargo, los modelos multinivel suponen que 1) los residuos de nivel 1 y nivel 2 no están correlacionados y 2) los errores (medidos por los residuos) en el nivel más alto no están correlacionados. [11]
Los regresores no deben correlacionarse con los efectos aleatorios, . Este supuesto es comprobable pero a menudo se ignora, lo que hace que el estimador sea inconsistente. [12] Si se viola este supuesto, el efecto aleatorio debe modelarse explícitamente en la parte fija del modelo, ya sea utilizando variables ficticias o incluyendo las medias de los grupos de todos los regresores. [12] [13] [14] [15] Este supuesto es probablemente el más importante que hace el estimador, pero es uno que la mayoría de los investigadores aplicados que utilizan este tipo de modelos no comprenden. [12]
El tipo de pruebas estadísticas que se emplean en los modelos multinivel depende de si se examinan los efectos fijos o los componentes de varianza. Al examinar los efectos fijos, las pruebas se comparan con el error estándar del efecto fijo, lo que da como resultado una prueba Z. [5] También se puede calcular una prueba t . Al calcular una prueba t, es importante tener en cuenta los grados de libertad, que dependerán del nivel del predictor (por ejemplo, predictor de nivel 1 o predictor de nivel 2). [5] Para un predictor de nivel 1, los grados de libertad se basan en el número de predictores de nivel 1, el número de grupos y el número de observaciones individuales. Para un predictor de nivel 2, los grados de libertad se basan en el número de predictores de nivel 2 y el número de grupos. [5]
La potencia estadística de los modelos multinivel difiere según se examinen los efectos de nivel 1 o de nivel 2. La potencia de los efectos de nivel 1 depende del número de observaciones individuales, mientras que la de los efectos de nivel 2 depende del número de grupos. [16] Para realizar una investigación con potencia suficiente, se requieren tamaños de muestra grandes en los modelos multinivel. Sin embargo, el número de observaciones individuales en los grupos no es tan importante como el número de grupos en un estudio. Para detectar interacciones entre niveles, siempre que los tamaños de los grupos no sean demasiado pequeños, se han hecho recomendaciones de que se necesitan al menos 20 grupos, [16] aunque se pueden utilizar muchos menos si uno solo está interesado en la inferencia sobre los efectos fijos y los efectos aleatorios son variables de control o "molestas". [4] La cuestión de la potencia estadística en los modelos multinivel se complica por el hecho de que la potencia varía en función del tamaño del efecto y las correlaciones intraclase, difiere para los efectos fijos frente a los efectos aleatorios, y cambia dependiendo del número de grupos y del número de observaciones individuales por grupo. [16]
El concepto de nivel es la piedra angular de este enfoque. En un ejemplo de investigación educativa , los niveles para un modelo de dos niveles podrían ser:
Sin embargo, si uno estudiara múltiples escuelas y múltiples distritos escolares, un modelo de 4 niveles podría incluir
El investigador debe establecer para cada variable el nivel en el que se midió. En este ejemplo, la "puntuación de la prueba" podría medirse a nivel de alumno, la "experiencia del docente" a nivel de clase, la "financiación escolar" a nivel de escuela y la "urbanización" a nivel de distrito.
Como ejemplo sencillo, consideremos un modelo de regresión lineal básico que predice los ingresos en función de la edad, la clase, el género y la raza. Se podría observar entonces que los niveles de ingresos también varían según la ciudad y el estado de residencia. Una forma sencilla de incorporar esto al modelo de regresión sería añadir una variable categórica independiente adicional para tener en cuenta la ubicación (es decir, un conjunto de predictores binarios adicionales y coeficientes de regresión asociados, uno por ubicación). Esto tendría el efecto de desplazar el ingreso medio hacia arriba o hacia abajo, pero seguiría suponiendo, por ejemplo, que el efecto de la raza y el género sobre el ingreso es el mismo en todas partes. En realidad, es poco probable que esto sea así: es probable que las diferentes leyes locales, las diferentes políticas de jubilación, las diferencias en el nivel de prejuicio racial, etc. hagan que todos los predictores tengan diferentes tipos de efectos en diferentes localidades.
En otras palabras, un modelo de regresión lineal simple podría, por ejemplo, predecir que una persona determinada seleccionada al azar en Seattle tendría un ingreso anual promedio de $10,000 más alto que una persona similar en Mobile, Alabama . Sin embargo, también predeciría, por ejemplo, que una persona blanca podría tener un ingreso promedio de $7,000 más alto que una persona negra, y una persona de 65 años podría tener un ingreso de $3,000 menos que una persona de 45 años, en ambos casos independientemente de la ubicación. Sin embargo, un modelo multinivel permitiría diferentes coeficientes de regresión para cada predictor en cada ubicación. Esencialmente, supondría que las personas en una ubicación dada tienen ingresos correlacionados generados por un solo conjunto de coeficientes de regresión, mientras que las personas en otra ubicación tienen ingresos generados por un conjunto diferente de coeficientes. Mientras tanto, se supone que los coeficientes mismos están correlacionados y generados a partir de un solo conjunto de hiperparámetros . Son posibles niveles adicionales: por ejemplo, las personas podrían agruparse por ciudades, y los coeficientes de regresión a nivel de ciudad podrían agruparse por estado, y los coeficientes a nivel de estado podrían generarse a partir de un único hiperhiperparámetro.
Los modelos multinivel son una subclase de los modelos bayesianos jerárquicos , que son modelos generales con múltiples niveles de variables aleatorias y relaciones arbitrarias entre las diferentes variables. El análisis multinivel se ha ampliado para incluir el modelado de ecuaciones estructurales multinivel, el modelado de clases latentes multinivel y otros modelos más generales.
Los modelos multinivel se han utilizado en la investigación educativa o geográfica para estimar por separado la varianza entre alumnos de una misma escuela y la varianza entre escuelas. En aplicaciones psicológicas, los niveles múltiples son elementos de un instrumento, individuos y familias. En aplicaciones sociológicas, los modelos multinivel se utilizan para examinar individuos insertos en regiones o países. En la investigación de psicología organizacional , los datos de individuos a menudo deben estar anidados dentro de equipos u otras unidades funcionales. A menudo se utilizan también en la investigación ecológica bajo el término más general de modelos mixtos . [4]
Diferentes covariables pueden ser relevantes en distintos niveles. Pueden utilizarse en estudios longitudinales, como en los estudios de crecimiento, para separar los cambios dentro de un individuo y las diferencias entre individuos.
Las interacciones entre niveles también pueden ser de interés sustancial; por ejemplo, cuando se permite que una pendiente varíe aleatoriamente, se puede incluir un predictor de nivel 2 en la fórmula de pendiente para la covariable de nivel 1. Por ejemplo, se puede estimar la interacción de la raza y el vecindario para obtener una estimación de la interacción entre las características de un individuo y el contexto social.
Existen varias formas alternativas de analizar datos jerárquicos, aunque la mayoría de ellas presentan algunos problemas. En primer lugar, se pueden utilizar técnicas estadísticas tradicionales. Se podrían desagregar las variables de orden superior a nivel individual y, por lo tanto, realizar un análisis a ese nivel individual (por ejemplo, asignar variables de clase a ese nivel). El problema con este enfoque es que violaría el supuesto de independencia y, por lo tanto, podría sesgar nuestros resultados. Esto se conoce como falacia atomística. [17] Otra forma de analizar los datos utilizando enfoques estadísticos tradicionales es agregar variables de nivel individual a variables de orden superior y luego realizar un análisis a ese nivel superior. El problema con este enfoque es que descarta toda la información dentro del grupo (porque toma el promedio de las variables de nivel individual). Se podría desperdiciar hasta un 80-90% de la varianza y la relación entre las variables agregadas se infla y, por lo tanto, se distorsiona. [18] Esto se conoce como falacia ecológica y, estadísticamente, este tipo de análisis da como resultado una disminución de la potencia además de la pérdida de información. [2]
Otra forma de analizar datos jerárquicos sería a través de un modelo de coeficientes aleatorios. Este modelo supone que cada grupo tiene un modelo de regresión diferente, con su propio intercepto y pendiente. [5] Debido a que los grupos son muestreados, el modelo supone que los interceptos y pendientes también son muestreados aleatoriamente de una población de interceptos y pendientes de grupo. Esto permite un análisis en el que se puede suponer que las pendientes son fijas pero se permite que los interceptos varíen. [5] Sin embargo, esto presenta un problema, ya que los componentes individuales son independientes, pero los componentes de grupo son independientes entre grupos, pero dependientes dentro de los grupos. Esto también permite un análisis en el que las pendientes son aleatorias; sin embargo, las correlaciones de los términos de error (perturbaciones) dependen de los valores de las variables de nivel individual. [5] Por lo tanto, el problema con el uso de un modelo de coeficientes aleatorios para analizar datos jerárquicos es que todavía no es posible incorporar variables de orden superior.
Los modelos multinivel tienen dos términos de error, también conocidos como perturbaciones. Los componentes individuales son todos independientes, pero también hay componentes de grupo, que son independientes entre grupos pero están correlacionados dentro de los grupos. Sin embargo, los componentes de varianza pueden diferir, ya que algunos grupos son más homogéneos que otros. [18]
El modelado multinivel se utiliza con frecuencia en diversas aplicaciones y puede formularse mediante el marco bayesiano. En particular, los modelos bayesianos no lineales de efectos mixtos han recibido recientemente una atención significativa. Una versión básica de los modelos bayesianos no lineales de efectos mixtos se representa en las tres etapas siguientes:
Etapa 1: Modelo a nivel individual
Etapa 2: Modelo de población
Etapa 3: Previa
Aquí, denota la respuesta continua del -ésimo sujeto en el punto temporal , y es la -ésima covariable del -ésimo sujeto. Los parámetros involucrados en el modelo se escriben en letras griegas. es una función conocida parametrizada por el vector -dimensional . Normalmente, es una función "no lineal" y describe la trayectoria temporal de los individuos. En el modelo, y describen la variabilidad intraindividual y la variabilidad entre individuos, respectivamente. Si no se considera la Etapa 3: previa , entonces el modelo se reduce a un modelo frecuentista no lineal de efectos mixtos.
Una tarea central en la aplicación de los modelos bayesianos no lineales de efectos mixtos es evaluar la densidad posterior:
El panel de la derecha muestra el ciclo de investigación bayesiano utilizando el modelo no lineal bayesiano de efectos mixtos. [19] Un ciclo de investigación que utiliza el modelo no lineal bayesiano de efectos mixtos comprende dos pasos: (a) ciclo de investigación estándar y (b) flujo de trabajo específico bayesiano. El ciclo de investigación estándar implica la revisión de la literatura, la definición de un problema y la especificación de la pregunta de investigación y la hipótesis. El flujo de trabajo específico bayesiano comprende tres subpasos: (b)–(i) formalización de distribuciones previas basadas en el conocimiento de fondo y la elicitación previa; (b)–(ii) determinación de la función de probabilidad basada en una función no lineal ; y (b)–(iii) realización de una inferencia posterior. La inferencia posterior resultante se puede utilizar para iniciar un nuevo ciclo de investigación.
{{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: |last=
tiene nombre genérico ( ayuda ){{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link)