Un modelo mixto , modelo de efectos mixtos o modelo de componentes de error mixto es un modelo estadístico que contiene tanto efectos fijos como efectos aleatorios . [1] [2] Estos modelos son útiles en una amplia variedad de disciplinas de las ciencias físicas, biológicas y sociales. Son particularmente útiles en entornos donde se realizan mediciones repetidas en las mismas unidades estadísticas ( estudio longitudinal ), o donde las mediciones se realizan en grupos de unidades estadísticas relacionadas. [2] Los modelos mixtos a menudo se prefieren al análisis tradicional de modelos de regresión de varianza debido a su flexibilidad para tratar con valores faltantes y espaciado desigual de mediciones repetidas. [3] El análisis del modelo mixto permite modelar explícitamente las mediciones en una variedad más amplia de estructuras de correlación y varianza - covarianza .
Esta página analizará principalmente modelos lineales de efectos mixtos en lugar de modelos lineales mixtos generalizados o modelos no lineales de efectos mixtos . [4]
Los modelos lineales mixtos (LMM) son modelos estadísticos que incorporan efectos fijos y aleatorios para representar con precisión estructuras de datos no independientes. LMM es una alternativa al análisis de varianza . A menudo, ANOVA supone la independencia de las observaciones dentro de cada grupo; sin embargo, esta suposición puede no ser válida en datos no independientes, como conjuntos de datos multinivel/ jerárquicos , longitudinales o correlacionados .
Los conjuntos no independientes son aquellos en los que la variabilidad entre resultados se debe a correlaciones dentro de los grupos o entre grupos. Los modelos mixtos tienen en cuenta adecuadamente las estructuras anidadas /estructuras de datos jerárquicas donde las observaciones están influenciadas por sus asociaciones anidadas. Por ejemplo, cuando se estudian métodos educativos que involucran a varias escuelas, hay múltiples niveles de variables a considerar. El nivel individual/nivel inferior comprende estudiantes o profesores individuales dentro de la escuela. Las observaciones obtenidas de este estudiante/maestro están anidadas dentro de su escuela. Por ejemplo, el Estudiante A es una unidad dentro de la Escuela A. El siguiente nivel superior es la escuela. En el nivel superior, la escuela contiene varios estudiantes y profesores individuales. El nivel escolar influye en las observaciones obtenidas de los estudiantes y profesores. Por ejemplo, la Escuela A y la Escuela B son los niveles superiores, cada uno con su conjunto de Estudiante A y Estudiante B respectivamente. Esto representa un esquema de datos jerárquico. Una solución para modelar datos jerárquicos es utilizar modelos lineales mixtos.
Los LMM nos permiten comprender los efectos importantes entre y dentro de los niveles al tiempo que incorporan las correcciones de errores estándar por no independencia integradas en la estructura de datos. [4] [5]
Los efectos fijos encapsulan las tendencias que son consistentes en los niveles de interés primario. Estos efectos se consideran fijos porque no son aleatorios y se supone que son constantes para la población que se estudia. [5] Por ejemplo, al estudiar la educación, un efecto fijo podría representar efectos generales a nivel escolar que son consistentes en todas las escuelas.
Si bien la jerarquía del conjunto de datos suele ser obvia, se deben especificar los efectos fijos específicos que afectan las respuestas promedio de todos los sujetos. Algunos coeficientes de efectos fijos son suficientes sin los correspondientes efectos aleatorios, mientras que otros coeficientes fijos solo representan un promedio cuando las unidades individuales son aleatorias. Estos pueden determinarse incorporando intersecciones y pendientes aleatorias . [6] [7] [8]
En la mayoría de las situaciones, se consideran varios modelos relacionados y se adopta el modelo que mejor representa un modelo universal.
Un componente clave del modelo mixto es la incorporación de efectos aleatorios con el efecto fijo. A menudo se ajustan efectos fijos para representar el modelo subyacente. En los modelos lineales mixtos, la verdadera regresión de la población es lineal, β. Los datos fijos se ajustan al más alto nivel. Los efectos aleatorios introducen variabilidad estadística en diferentes niveles de la jerarquía de datos. Estos explican las fuentes de varianza no medidas que afectan a ciertos grupos en los datos. Por ejemplo, las diferencias entre el alumno 1 y el alumno 2 en la misma clase, o las diferencias entre la clase 1 y la clase 2 en la misma escuela. [6] [7] [8]
Ronald Fisher introdujo modelos de efectos aleatorios para estudiar las correlaciones de valores de rasgos entre parientes. [9] En la década de 1950, Charles Roy Henderson proporcionó las mejores estimaciones lineales insesgadas de efectos fijos y las mejores predicciones lineales insesgadas de efectos aleatorios. [10] [11] [12] [13] Posteriormente, el modelado mixto se ha convertido en un área importante de investigación estadística, incluido el trabajo sobre el cálculo de estimaciones de máxima verosimilitud, modelos de efectos mixtos no lineales, datos faltantes en modelos de efectos mixtos y modelos bayesianos. estimación de modelos de efectos mixtos. Los modelos mixtos se aplican en muchas disciplinas donde se realizan múltiples mediciones correlacionadas en cada unidad de interés. Se utilizan de manera destacada en investigaciones que involucran sujetos humanos y animales en campos que van desde la genética hasta el marketing, y también se han utilizado en el béisbol [14] y en las estadísticas industriales. [15] La asociación del modelo lineal mixto ha mejorado la prevención de asociaciones de falsos positivos. Las poblaciones están profundamente interconectadas y la estructura de relaciones de la dinámica poblacional es extremadamente difícil de modelar sin el uso de modelos mixtos. Sin embargo, es posible que los modelos lineales mixtos no sean la única solución. Los LMM tienen un supuesto de varianza residual constante que a veces se viola cuando se contabilizan o se asocian rasgos continuos y binarios profundamente. [dieciséis]
En notación matricial, un modelo lineal mixto se puede representar como
dónde
La densidad conjunta de y se puede escribir como: . Suponiendo normalidad, y , y maximizando la densidad conjunta sobre y , se obtienen las "ecuaciones de modelos mixtos" (MME) de Henderson para modelos lineales mixtos: [10] [12] [17]
Las soluciones del MME, y son los mejores predictores y estimaciones lineales insesgados para y , respectivamente. Esto es una consecuencia del teorema de Gauss-Markov cuando la varianza condicional del resultado no es escalable a la matriz identidad. Cuando se conoce la varianza condicional, entonces la estimación de mínimos cuadrados ponderada de la varianza inversa es la mejor estimación lineal insesgada. Sin embargo, la varianza condicional rara vez se conoce. Por lo tanto, es deseable estimar conjuntamente la varianza y las estimaciones de parámetros ponderados al resolver MME.
Un método utilizado para ajustar estos modelos mixtos es el del algoritmo de maximización de expectativas (EM), donde los componentes de la varianza se tratan como parámetros molestos no observados en la probabilidad conjunta. [18] Actualmente, este es el método implementado en software estadístico como Python ( paquete statsmodels ) y SAS (proc mixto), y como paso inicial solo en el paquete nlme de R , lme(). La solución de las ecuaciones del modelo mixto es una estimación de máxima verosimilitud cuando la distribución de los errores es normal. [19] [20]
Hay varios otros métodos para ajustar modelos mixtos, incluido el uso de un MEM inicialmente y luego Newton-Raphson (usado por lme() del paquete R nlme [21] ), penalizado por mínimos cuadrados para obtener una probabilidad logarítmica perfilada solo dependiendo del parámetros de varianza-covarianza (de baja dimensión) de , es decir, su matriz cov , y luego la optimización directa moderna para esa función objetivo reducida (utilizada por el paquete lme4 [22] de R lmer() y el paquete de Julia MixedModels.jl) y optimización directa de la probabilidad (utilizada, por ejemplo, por glmmTMB de R ). En particular, si bien la forma canónica propuesta por Henderson es útil para la teoría, muchos paquetes de software populares utilizan una formulación diferente para el cálculo numérico con el fin de aprovechar los métodos de matrices dispersas (por ejemplo, lme4 y MixedModels.jl).
{{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link){{cite book}}
: CS1 maint: multiple names: authors list (link)