Un modelo mixto , modelo de efectos mixtos o modelo de componentes de error mixto es un modelo estadístico que contiene tanto efectos fijos como efectos aleatorios . [1] [2] Estos modelos son útiles en una amplia variedad de disciplinas en las ciencias físicas, biológicas y sociales. Son particularmente útiles en entornos donde se realizan mediciones repetidas en las mismas unidades estadísticas (ver también estudio longitudinal ), o donde las mediciones se realizan en grupos de unidades estadísticas relacionadas. [2] Los modelos mixtos a menudo se prefieren a los modelos de regresión de análisis de varianza tradicionales porque no se basan en el supuesto de observaciones independientes. Además, tienen su flexibilidad para tratar los valores faltantes y el espaciado desigual de las mediciones repetidas. [3] El análisis del modelo mixto permite que las mediciones se modelen explícitamente en una variedad más amplia de estructuras de correlación y varianza - covarianza evitando estimaciones sesgadas .
En esta página se analizarán principalmente modelos lineales de efectos mixtos en lugar de modelos lineales mixtos generalizados o modelos no lineales de efectos mixtos . [4]
Los modelos lineales mixtos (LMM) son modelos estadísticos que incorporan efectos fijos y aleatorios para representar con precisión estructuras de datos no independientes. Los LMM son una alternativa al análisis de varianza . A menudo, el ANOVA supone la independencia de las observaciones dentro de cada grupo; sin embargo, esta suposición puede no ser válida en datos no independientes, como conjuntos de datos multinivel/ jerárquicos , longitudinales o correlacionados .
Los conjuntos no independientes son aquellos en los que la variabilidad entre los resultados se debe a correlaciones dentro de los grupos o entre grupos. Los modelos mixtos dan cuenta adecuadamente de las estructuras de anidación /estructuras de datos jerárquicas donde las observaciones se ven influenciadas por sus asociaciones anidadas. Por ejemplo, al estudiar métodos educativos que involucran múltiples escuelas, hay múltiples niveles de variables a considerar. El nivel individual/nivel inferior comprende estudiantes o maestros individuales dentro de la escuela. Las observaciones obtenidas de este estudiante/maestro están anidadas dentro de su escuela. Por ejemplo, el Estudiante A es una unidad dentro de la Escuela A. El siguiente nivel superior es la escuela. En el nivel superior, la escuela contiene múltiples estudiantes y maestros individuales. El nivel de la escuela influye en las observaciones obtenidas de los estudiantes y maestros. Por ejemplo, la Escuela A y la Escuela B son los niveles superiores, cada uno con su conjunto de Estudiante A y Estudiante B respectivamente. Esto representa un esquema de datos jerárquico. Una solución para modelar datos jerárquicos es usar modelos mixtos lineales.
Los LMM nos permiten comprender los efectos importantes entre y dentro de los niveles al tiempo que incorporan las correcciones para los errores estándar por no independencia incorporadas en la estructura de datos. [4] [5]
Los efectos fijos encapsulan las tendencias que son consistentes en los niveles de interés primario. Estos efectos se consideran fijos porque no son aleatorios y se supone que son constantes para la población en estudio. [5] Por ejemplo, al estudiar la educación, un efecto fijo podría representar efectos generales a nivel escolar que sean consistentes en todas las escuelas.
Si bien la jerarquía del conjunto de datos suele ser obvia, se deben especificar los efectos fijos específicos que afectan las respuestas promedio de todos los sujetos. Algunos coeficientes de efectos fijos son suficientes sin los efectos aleatorios correspondientes, mientras que otros coeficientes fijos solo representan un promedio en el que las unidades individuales son aleatorias. Estos se pueden determinar incorporando interceptos y pendientes aleatorios . [6] [7] [8]
En la mayoría de las situaciones se consideran varios modelos relacionados y se adopta el modelo que mejor representa un modelo universal.
Un componente clave del modelo mixto es la incorporación de efectos aleatorios con el efecto fijo. Los efectos fijos se ajustan a menudo para representar el modelo subyacente. En los modelos mixtos lineales, la verdadera regresión de la población es lineal, β. Los datos fijos se ajustan en el nivel más alto. Los efectos aleatorios introducen variabilidad estadística en diferentes niveles de la jerarquía de datos. Estos dan cuenta de las fuentes de varianza no medidas que afectan a ciertos grupos en los datos. Por ejemplo, las diferencias entre el estudiante 1 y el estudiante 2 en la misma clase, o las diferencias entre la clase 1 y la clase 2 en la misma escuela. [6] [7] [8]
Ronald Fisher introdujo los modelos de efectos aleatorios para estudiar las correlaciones de los valores de los rasgos entre parientes. [9] En la década de 1950, Charles Roy Henderson proporcionó las mejores estimaciones lineales imparciales de los efectos fijos y las mejores predicciones lineales imparciales de los efectos aleatorios. [10] [11] [12] [13] Posteriormente, el modelado mixto se ha convertido en un área importante de la investigación estadística, incluido el trabajo sobre el cálculo de estimaciones de máxima verosimilitud, modelos de efectos mixtos no lineales, datos faltantes en modelos de efectos mixtos y estimación bayesiana de modelos de efectos mixtos. Los modelos mixtos se aplican en muchas disciplinas donde se realizan múltiples mediciones correlacionadas en cada unidad de interés. Se utilizan de forma destacada en la investigación que involucra a sujetos humanos y animales en campos que van desde la genética hasta el marketing, y también se han utilizado en el béisbol [14] y las estadísticas industriales. [15] La asociación del modelo lineal mixto ha mejorado la prevención de asociaciones de falsos positivos. Las poblaciones están profundamente interconectadas y la estructura de parentesco de la dinámica poblacional es extremadamente difícil de modelar sin el uso de modelos mixtos. Sin embargo, los modelos lineales mixtos pueden no ser la única solución. Los LMM tienen un supuesto de varianza residual constante que a veces se viola cuando se contabilizan o asocian profundamente rasgos continuos y binarios . [16]
En notación matricial, un modelo lineal mixto se puede representar como
dónde
Por ejemplo, si cada observación puede pertenecer a cero o más de k categorías, entonces Z , que tiene una fila por observación, puede elegirse para tener k columnas, donde un valor de 1 para un elemento de matriz de Z indica que se sabe que una observación pertenece a una categoría y un valor de 0 indica que se sabe que una observación no pertenece a una categoría. El valor inferido de u para una categoría es entonces una intersección específica de la categoría . Si Z tiene columnas adicionales, donde los valores distintos de cero son en cambio el valor de una variable independiente para una observación, entonces el valor inferido correspondiente de u es una pendiente específica de la categoría para esa variable independiente. La distribución previa para las intersecciones y pendientes de la categoría se describe mediante la matriz de covarianza G .
La densidad conjunta de y se puede escribir como: . Suponiendo normalidad, , y , y maximizando la densidad conjunta sobre y , se obtienen las "ecuaciones de modelo mixto" (MME) de Henderson para modelos mixtos lineales: [10] [12] [17]
donde por ejemplo X′ es la matriz transpuesta de X y R −1 es la matriz inversa de R .
Las soluciones de la MME, y son las mejores estimaciones lineales imparciales y predictores para y , respectivamente. Esto es una consecuencia del teorema de Gauss-Markov cuando la varianza condicional del resultado no es escalable a la matriz identidad. Cuando se conoce la varianza condicional, entonces la estimación de mínimos cuadrados ponderada por la varianza inversa es la mejor estimación lineal imparcial. Sin embargo, la varianza condicional rara vez, o nunca, se conoce. Por lo tanto, es deseable estimar conjuntamente la varianza y las estimaciones de los parámetros ponderados al resolver MME.
Un método utilizado para ajustar estos modelos mixtos es el del algoritmo de expectativa-maximización (EM), donde los componentes de varianza se tratan como parámetros de molestia no observados en la verosimilitud conjunta. [18] Actualmente, este es el método implementado en software estadístico como Python (paquete statsmodels) y SAS (proc mixed), y como paso inicial solo en el paquete nlme de R lme(). La solución a las ecuaciones del modelo mixto es una estimación de máxima verosimilitud cuando la distribución de los errores es normal. [19] [20]
Existen otros métodos para ajustar modelos mixtos, incluido el uso de un modelo de efectos mixtos (MEM) inicialmente, y luego Newton-Raphson (usado por lme() del paquete nlme [21] de R ), mínimos cuadrados penalizados para obtener una verosimilitud perfilada solo dependiendo de los parámetros de varianza-covarianza (de baja dimensión) de , es decir, su matriz cov , y luego la optimización directa moderna para esa función objetivo reducida (usada por el paquete lmer() de lme4 [22] de R y el paquete de Julia MixedModels.jl) y la optimización directa de la verosimilitud (usada por, por ejemplo, glmmTMB de R ). En particular, si bien la forma canónica propuesta por Henderson es útil para la teoría, muchos paquetes de software populares usan una formulación diferente para el cálculo numérico con el fin de aprovechar los métodos de matriz dispersa (por ejemplo, lme4 y MixedModels.jl).
{{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link)