Los modelos multinivel (también conocidos como modelos lineales jerárquicos , modelos lineales de efectos mixtos , modelos mixtos , modelos de datos anidados , modelos de coeficientes aleatorios , modelos de efectos aleatorios , modelos de parámetros aleatorios o diseños de parcelas divididas ) son modelos estadísticos de parámetros que varían en más de un nivel. [1] Un ejemplo podría ser un modelo de desempeño estudiantil que contenga medidas para estudiantes individuales así como medidas para aulas dentro de las cuales se agrupan los estudiantes. Estos modelos pueden verse como generalizaciones de modelos lineales (en particular, regresión lineal ), aunque también pueden extenderse a modelos no lineales. Estos modelos se hicieron mucho más populares después de que estuvo disponible suficiente potencia informática y software. [1]
Los modelos multinivel son particularmente apropiados para diseños de investigación donde los datos de los participantes están organizados en más de un nivel (es decir, datos anidados ). [2] Las unidades de análisis suelen ser individuos (en un nivel inferior) que están anidados dentro de unidades contextuales/agregadas (en un nivel superior). [3] Si bien el nivel más bajo de datos en los modelos multinivel suele ser un individuo, también se pueden examinar mediciones repetidas de individuos. [2] [4] Como tal, los modelos multinivel proporcionan un tipo alternativo de análisis para el análisis univariado o multivariado de medidas repetidas . Se pueden examinar las diferencias individuales en las curvas de crecimiento . [2] Además, los modelos multinivel se pueden utilizar como alternativa a ANCOVA , donde las puntuaciones de la variable dependiente se ajustan según las covariables (por ejemplo, diferencias individuales) antes de probar las diferencias de tratamiento. [5] Los modelos multinivel pueden analizar estos experimentos sin los supuestos de pendientes de homogeneidad de regresión que requiere ANCOVA. [2]
Los modelos multinivel se pueden utilizar en datos con muchos niveles, aunque los modelos de 2 niveles son los más comunes y el resto de este artículo trata solo de estos. La variable dependiente debe examinarse en el nivel más bajo de análisis. [1]
Cuando hay una única variable independiente de nivel 1, el modelo de nivel 1 es
.
En el Nivel 1, tanto las intersecciones como las pendientes en los grupos pueden ser fijas (lo que significa que todos los grupos tienen los mismos valores, aunque en el mundo real esto sería poco común), y variar no aleatoriamente (lo que significa que las intersecciones y/o o las pendientes son predecibles a partir de una variable independiente en el Nivel 2), o varían aleatoriamente (lo que significa que las intersecciones y/o pendientes son diferentes en los diferentes grupos, y que cada uno tiene su propia media y varianza generales). [2] [4]
Cuando hay múltiples variables independientes de nivel 1, el modelo se puede expandir sustituyendo vectores y matrices en la ecuación.
Cuando la relación entre la respuesta y el predictor no puede describirse mediante una relación lineal, entonces se puede encontrar alguna relación funcional no lineal entre la respuesta y el predictor y extender el modelo a un modelo no lineal de efectos mixtos . Por ejemplo, cuando la respuesta es la trayectoria de infección acumulada del -ésimo país y representa los -ésimos puntos de tiempo, entonces el par ordenado para cada país puede mostrar una forma similar a la función logística . [6] [7]
Las variables dependientes son las intersecciones y las pendientes de las variables independientes en el Nivel 1 en los grupos del Nivel 2.
Antes de realizar un análisis de modelo multinivel, un investigador debe decidir sobre varios aspectos, incluido qué predictores se incluirán en el análisis, si corresponde. En segundo lugar, el investigador debe decidir si los valores de los parámetros (es decir, los elementos que se estimarán) serán fijos o aleatorios. [2] [5] [4] Los parámetros fijos se componen de una constante en todos los grupos, mientras que un parámetro aleatorio tiene un valor diferente para cada uno de los grupos. [4] Además, el investigador debe decidir si emplea una estimación de máxima verosimilitud o un tipo de estimación de máxima verosimilitud restringida. [2]
Un modelo de interceptos aleatorios es un modelo en el que se permite que los interceptos varíen y, por lo tanto, las puntuaciones de la variable dependiente para cada observación individual se predicen mediante el intercepto que varía entre los grupos. [5] [8] [4] Este modelo supone que las pendientes son fijas (las mismas en diferentes contextos). Además, este modelo proporciona información sobre las correlaciones intraclase , que son útiles para determinar si se requieren modelos multinivel en primer lugar. [2]
Un modelo de pendientes aleatorias es un modelo en el que se permite que las pendientes varíen según una matriz de correlación y, por lo tanto, las pendientes son diferentes según la variable de agrupación, como el tiempo o los individuos. Este modelo supone que las intersecciones son fijas (las mismas en diferentes contextos). [5]
Un modelo que incluye tanto intersecciones aleatorias como pendientes aleatorias es probablemente el tipo de modelo más realista, aunque también es el más complejo. En este modelo, se permite que tanto las intersecciones como las pendientes varíen entre grupos, lo que significa que son diferentes en diferentes contextos. [5]
Para realizar un análisis de modelo multinivel, se comenzaría con coeficientes fijos (pendientes e intersecciones). Se permitiría que un aspecto varíe a la vez (es decir, se cambiaría) y se compararía con el modelo anterior para evaluar un mejor ajuste del modelo. [1] Hay tres preguntas diferentes que un investigador haría al evaluar un modelo. Primero, ¿es un buen modelo? En segundo lugar, ¿es mejor un modelo más complejo? En tercer lugar, ¿qué contribución hacen los predictores individuales al modelo?
Para evaluar los modelos, se examinarían diferentes estadísticas de ajuste del modelo. [2] Una de esas estadísticas es la prueba de probabilidad de chi-cuadrado , que evalúa la diferencia entre modelos. La prueba de razón de verosimilitud se puede emplear para la construcción de modelos en general, para examinar qué sucede cuando se permite que varíen los efectos en un modelo y cuando se prueba una variable categórica codificada como un efecto único. [2] Sin embargo, la prueba solo se puede utilizar cuando los modelos están anidados (lo que significa que un modelo más complejo incluye todos los efectos de un modelo más simple). Al probar modelos no anidados, se pueden realizar comparaciones entre modelos utilizando el criterio de información de Akaike (AIC) o el criterio de información bayesiano (BIC), entre otros. [1] [2] [5] Ver más selección de modelos .
Los modelos multinivel tienen los mismos supuestos que otros modelos lineales generales importantes (por ejemplo, ANOVA , regresión ), pero algunos de los supuestos se modifican debido a la naturaleza jerárquica del diseño (es decir, datos anidados).
El supuesto de linealidad establece que existe una relación rectilínea (en línea recta, a diferencia de no lineal o en forma de U) entre variables. [9] Sin embargo, el modelo puede ampliarse a relaciones no lineales. [10] En particular, cuando la parte media de la ecuación de regresión de nivel 1 se reemplaza con una función paramétrica no lineal, dicho marco de modelo se denomina ampliamente modelo no lineal de efectos mixtos . [7]
El supuesto de normalidad establece que los términos de error en cada nivel del modelo se distribuyen normalmente. [9] [ disputado – discutir ] Sin embargo, la mayoría del software estadístico permite especificar diferentes distribuciones para los términos de varianza, como Poisson, binomial, logística. El enfoque de modelado multinivel se puede utilizar para todas las formas de modelos lineales generalizados.
El supuesto de homocedasticidad , también conocido como homogeneidad de varianza, supone igualdad de varianzas poblacionales. [9] Sin embargo, se pueden especificar diferentes matrices de correlación de varianza para tener en cuenta esto, y se puede modelar la heterogeneidad de la varianza.
La independencia es un supuesto de los modelos lineales generales, que establece que los casos son muestras aleatorias de la población y que las puntuaciones de la variable dependiente son independientes entre sí. [9] Uno de los principales propósitos de los modelos multinivel es abordar casos en los que se viola el supuesto de independencia; Sin embargo, los modelos multinivel suponen que 1) los residuos de nivel 1 y 2 no están correlacionados y 2) los errores (medidos por los residuos) en el nivel más alto no están correlacionados. [11]
Los regresores no deben correlacionarse con los efectos aleatorios . Este supuesto es comprobable pero a menudo se ignora, lo que hace que el estimador sea inconsistente. [12] Si se viola este supuesto, el efecto aleatorio debe modelarse explícitamente en la parte fija del modelo, ya sea utilizando variables ficticias o incluyendo medias de conglomerados de todos los regresores. [12] [13] [14] [15] Este supuesto es probablemente el más importante que hace el estimador, pero es mal entendido por la mayoría de los investigadores aplicados que utilizan este tipo de modelos. [12]
El tipo de pruebas estadísticas que se emplean en los modelos multinivel depende de si se examinan efectos fijos o componentes de varianza. Al examinar los efectos fijos, las pruebas se comparan con el error estándar del efecto fijo, lo que da como resultado una prueba Z. [5] También se puede calcular una prueba t . Al calcular una prueba t, es importante tener en cuenta los grados de libertad, que dependerán del nivel del predictor (p. ej., predictor de nivel 1 o predictor de nivel 2). [5] Para un predictor de nivel 1, los grados de libertad se basan en el número de predictores de nivel 1, el número de grupos y el número de observaciones individuales. Para un predictor de nivel 2, los grados de libertad se basan en la cantidad de predictores de nivel 2 y la cantidad de grupos. [5]
El poder estadístico de los modelos multinivel difiere dependiendo de si se examinan los efectos del nivel 1 o del nivel 2. El poder de los efectos de nivel 1 depende del número de observaciones individuales, mientras que el poder de los efectos de nivel 2 depende del número de grupos. [16] Para realizar investigaciones con suficiente poder, se requieren tamaños de muestra grandes en modelos multinivel. Sin embargo, el número de observaciones individuales en grupos no es tan importante como el número de grupos en un estudio. Para detectar interacciones entre niveles, dado que los tamaños de los grupos no son demasiado pequeños, se ha recomendado que se necesitan al menos 20 grupos, [16] aunque se pueden usar muchos menos si uno sólo está interesado en la inferencia sobre el nivel fijo. Los efectos y los efectos aleatorios son variables de control o "molestas". [4] La cuestión del poder estadístico en los modelos multinivel se complica por el hecho de que el poder varía en función del tamaño del efecto y las correlaciones intraclase, difiere para efectos fijos versus efectos aleatorios, y cambia dependiendo del número de grupos y del número de grupos. de observaciones individuales por grupo. [dieciséis]
El concepto de nivel es la piedra angular de este enfoque. En un ejemplo de investigación educativa , los niveles para un modelo de 2 niveles podrían ser
Sin embargo, si uno estuviera estudiando varias escuelas y distritos escolares múltiples, un modelo de 4 niveles podría incluir
El investigador debe establecer para cada variable el nivel en el que fue medida. En este ejemplo, la "puntaje de la prueba" podría medirse a nivel de alumno, la "experiencia docente" a nivel de clase, la "financiación escolar" a nivel de escuela y "urbano" a nivel de distrito.
Como ejemplo sencillo, consideremos un modelo de regresión lineal básico que predice los ingresos en función de la edad, la clase social, el género y la raza. Se podría observar entonces que los niveles de ingresos también varían según la ciudad y el estado de residencia. Una forma sencilla de incorporar esto al modelo de regresión sería agregar una variable categórica independiente adicional para tener en cuenta la ubicación (es decir, un conjunto de predictores binarios adicionales y coeficientes de regresión asociados, uno por ubicación). Esto tendría el efecto de desplazar el ingreso medio hacia arriba o hacia abajo, pero seguiría suponiendo, por ejemplo, que el efecto de la raza y el género sobre el ingreso es el mismo en todas partes. En realidad, es poco probable que este sea el caso: diferentes leyes locales, diferentes políticas de jubilación, diferencias en el nivel de prejuicio racial, etc. probablemente causen que todos los predictores tengan diferentes tipos de efectos en diferentes lugares.
En otras palabras, un modelo de regresión lineal simple podría, por ejemplo, predecir que una persona determinada de la muestra aleatoria en Seattle tendría un ingreso anual promedio $10,000 más que una persona similar en Mobile, Alabama . Sin embargo, también predeciría, por ejemplo, que una persona blanca podría tener un ingreso promedio de 7.000 dólares por encima de una persona negra, y una persona de 65 años podría tener un ingreso de 3.000 dólares por debajo de una persona de 45 años, en ambos casos independientemente de ubicación. Sin embargo, un modelo multinivel permitiría diferentes coeficientes de regresión para cada predictor en cada ubicación. Esencialmente, se asumiría que las personas en un lugar determinado tienen ingresos correlacionados generados por un único conjunto de coeficientes de regresión, mientras que las personas en otro lugar tienen ingresos generados por un conjunto diferente de coeficientes. Mientras tanto, se supone que los propios coeficientes están correlacionados y generados a partir de un único conjunto de hiperparámetros . Son posibles niveles adicionales: por ejemplo, las personas podrían agruparse por ciudades, y los coeficientes de regresión a nivel de ciudad agrupados por estado, y los coeficientes a nivel estatal generados a partir de un único hiperhiperparámetro.
Los modelos multinivel son una subclase de los modelos bayesianos jerárquicos , que son modelos generales con múltiples niveles de variables aleatorias y relaciones arbitrarias entre las diferentes variables. El análisis multinivel se ha ampliado para incluir modelado de ecuaciones estructurales multinivel , modelado de clases latentes multinivel y otros modelos más generales.
Los modelos multinivel se han utilizado en investigaciones educativas o geográficas para estimar por separado la varianza entre alumnos dentro de la misma escuela y la varianza entre escuelas. En aplicaciones psicológicas, los múltiples niveles son elementos de un instrumento, individuos y familias. En aplicaciones sociológicas, los modelos multinivel se utilizan para examinar individuos integrados en regiones o países. En la investigación en psicología organizacional , los datos de los individuos a menudo deben anidarse dentro de equipos u otras unidades funcionales. A menudo se utilizan en investigaciones ecológicas y bajo el término más general de modelos mixtos . [4]
Diferentes covariables pueden ser relevantes en diferentes niveles. Se pueden utilizar para estudios longitudinales, como ocurre con los estudios de crecimiento, para separar los cambios dentro de un individuo y las diferencias entre individuos.
Las interacciones entre niveles también pueden ser de gran interés; por ejemplo, cuando se permite que una pendiente varíe aleatoriamente, se puede incluir un predictor de nivel 2 en la fórmula de pendiente para la covariable de nivel 1. Por ejemplo, se puede estimar la interacción de raza y vecindario para obtener una estimación de la interacción entre las características de un individuo y el contexto social.
Existen varias formas alternativas de analizar datos jerárquicos, aunque la mayoría de ellas tienen algunos problemas. En primer lugar, se pueden utilizar técnicas estadísticas tradicionales. Se podrían desagregar variables de orden superior al nivel individual y así realizar un análisis en este nivel individual (por ejemplo, asignar variables de clase al nivel individual). El problema con este enfoque es que violaría el supuesto de independencia y, por tanto, podría sesgar nuestros resultados. Esto se conoce como falacia atomística. [17] Otra forma de analizar los datos utilizando enfoques estadísticos tradicionales es agregar variables de nivel individual a variables de orden superior y luego realizar un análisis en este nivel superior. El problema con este enfoque es que descarta toda la información dentro del grupo (porque toma el promedio de las variables a nivel individual). Se podría desperdiciar entre el 80% y el 90% de la varianza, y la relación entre las variables agregadas estaría inflada y, por tanto, distorsionada. [18] Esto se conoce como falacia ecológica y, estadísticamente, este tipo de análisis da como resultado una disminución del poder además de la pérdida de información. [2]
Otra forma de analizar datos jerárquicos sería mediante un modelo de coeficientes aleatorios. Este modelo supone que cada grupo tiene un modelo de regresión diferente, con su propia intersección y pendiente. [5] Debido a que los grupos son muestreados, el modelo supone que las intersecciones y pendientes también se muestrean aleatoriamente de una población de intersecciones y pendientes de grupo. Esto permite un análisis en el que se puede suponer que las pendientes son fijas pero se permite que las intersecciones varíen. [5] Sin embargo, esto presenta un problema, ya que los componentes individuales son independientes pero los componentes del grupo son independientes entre grupos, pero dependientes dentro de los grupos. Esto también permite un análisis en el que las pendientes son aleatorias; sin embargo, las correlaciones de los términos de error (perturbaciones) dependen de los valores de las variables a nivel individual. [5] Por lo tanto, el problema con el uso de un modelo de coeficientes aleatorios para analizar datos jerárquicos es que todavía no es posible incorporar variables de orden superior.
Los modelos multinivel tienen dos términos de error, que también se conocen como perturbaciones. Los componentes individuales son todos independientes, pero también hay componentes grupales, que son independientes entre grupos pero están correlacionados dentro de los grupos. Sin embargo, los componentes de la varianza pueden diferir, ya que algunos grupos son más homogéneos que otros. [18]
El modelado multinivel se utiliza con frecuencia en diversas aplicaciones y puede formularse mediante el marco bayesiano. En particular, los modelos bayesianos no lineales de efectos mixtos han recibido recientemente una atención significativa. Una versión básica de los modelos bayesianos no lineales de efectos mixtos se representa en las siguientes tres etapas:
Etapa 1: modelo a nivel individual
Etapa 2: Modelo de población
Etapa 3: previa
Aquí, denota la respuesta continua del -ésimo sujeto en el momento y es la -ésima covariable del -ésimo sujeto. Los parámetros involucrados en el modelo están escritos en letras griegas. es una función conocida parametrizada por el vector -dimensional . Normalmente, es una función "no lineal" y describe la trayectoria temporal de los individuos. En el modelo, y describen la variabilidad intraindividual y la variabilidad entre individuos, respectivamente. Si no se considera la Etapa 3: Previa , entonces el modelo se reduce a un modelo frecuentista no lineal de efectos mixtos.
Una tarea central en la aplicación de los modelos bayesianos no lineales de efectos mixtos es evaluar la densidad posterior:
El panel de la derecha muestra el ciclo de investigación bayesiano utilizando el modelo bayesiano de efectos mixtos no lineal. [19] Un ciclo de investigación que utiliza el modelo bayesiano de efectos mixtos no lineal comprende dos pasos: (a) ciclo de investigación estándar y (b) flujo de trabajo bayesiano específico. El ciclo de investigación estándar implica la revisión de la literatura, la definición de un problema y la especificación de la pregunta y la hipótesis de la investigación. El flujo de trabajo específico bayesiano comprende tres subpasos: (b) – (i) formalizar distribuciones previas basadas en conocimientos previos y obtención previa; (b)–(ii) determinar la función de probabilidad basándose en una función no lineal ; y (b)–(iii) hacer una inferencia posterior. La inferencia posterior resultante se puede utilizar para iniciar un nuevo ciclo de investigación.
{{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: |last=
tiene nombre genérico ( ayuda ){{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link)