Modelo mixto

Un modelo mixto , modelo de efectos mixtos o modelo de componentes de error mixto es un modelo estadístico que contiene tanto efectos fijos como efectos aleatorios . ^[1]^[2] Estos modelos son útiles en una amplia variedad de disciplinas de las ciencias físicas, biológicas y sociales. Son particularmente útiles en entornos donde se realizan mediciones repetidas en las mismas unidades estadísticas ( estudio longitudinal ), o donde las mediciones se realizan en grupos de unidades estadísticas relacionadas. ^[2] Los modelos mixtos a menudo se prefieren al análisis tradicional de modelos de regresión de varianza debido a su flexibilidad para tratar con valores faltantes y espaciado desigual de mediciones repetidas. ^[3] El análisis del modelo mixto permite modelar explícitamente las mediciones en una variedad más amplia de estructuras de correlación y varianza - covarianza .

Esta página analizará principalmente modelos lineales de efectos mixtos en lugar de modelos lineales mixtos generalizados o modelos no lineales de efectos mixtos . ^[4]

Descripción cualitativa

Los modelos lineales mixtos (LMM) son modelos estadísticos que incorporan efectos fijos y aleatorios para representar con precisión estructuras de datos no independientes. LMM es una alternativa al análisis de varianza . A menudo, ANOVA supone la independencia de las observaciones dentro de cada grupo; sin embargo, esta suposición puede no ser válida en datos no independientes, como conjuntos de datos multinivel/ jerárquicos , longitudinales o correlacionados .

Los conjuntos no independientes son aquellos en los que la variabilidad entre resultados se debe a correlaciones dentro de los grupos o entre grupos. Los modelos mixtos tienen en cuenta adecuadamente las estructuras anidadas /estructuras de datos jerárquicas donde las observaciones están influenciadas por sus asociaciones anidadas. Por ejemplo, cuando se estudian métodos educativos que involucran a varias escuelas, hay múltiples niveles de variables a considerar. El nivel individual/nivel inferior comprende estudiantes o profesores individuales dentro de la escuela. Las observaciones obtenidas de este estudiante/maestro están anidadas dentro de su escuela. Por ejemplo, el Estudiante A es una unidad dentro de la Escuela A. El siguiente nivel superior es la escuela. En el nivel superior, la escuela contiene varios estudiantes y profesores individuales. El nivel escolar influye en las observaciones obtenidas de los estudiantes y profesores. Por ejemplo, la Escuela A y la Escuela B son los niveles superiores, cada uno con su conjunto de Estudiante A y Estudiante B respectivamente. Esto representa un esquema de datos jerárquico. Una solución para modelar datos jerárquicos es utilizar modelos lineales mixtos.

Los LMM nos permiten comprender los efectos importantes entre y dentro de los niveles al tiempo que incorporan las correcciones de errores estándar por no independencia integradas en la estructura de datos. ^[4]^[5]

El efecto fijo

Los efectos fijos encapsulan las tendencias que son consistentes en los niveles de interés primario. Estos efectos se consideran fijos porque no son aleatorios y se supone que son constantes para la población que se estudia. ^[5] Por ejemplo, al estudiar la educación, un efecto fijo podría representar efectos generales a nivel escolar que son consistentes en todas las escuelas.

Si bien la jerarquía del conjunto de datos suele ser obvia, se deben especificar los efectos fijos específicos que afectan las respuestas promedio de todos los sujetos. Algunos coeficientes de efectos fijos son suficientes sin los correspondientes efectos aleatorios, mientras que otros coeficientes fijos solo representan un promedio cuando las unidades individuales son aleatorias. Estos pueden determinarse incorporando intersecciones y pendientes aleatorias . ^[6]^[7]^[8]

En la mayoría de las situaciones, se consideran varios modelos relacionados y se adopta el modelo que mejor representa un modelo universal.

El efecto aleatorio, ε

Un componente clave del modelo mixto es la incorporación de efectos aleatorios con el efecto fijo. A menudo se ajustan efectos fijos para representar el modelo subyacente. En los modelos lineales mixtos, la verdadera regresión de la población es lineal, β. Los datos fijos se ajustan al más alto nivel. Los efectos aleatorios introducen variabilidad estadística en diferentes niveles de la jerarquía de datos. Estos explican las fuentes de varianza no medidas que afectan a ciertos grupos en los datos. Por ejemplo, las diferencias entre el alumno 1 y el alumno 2 en la misma clase, o las diferencias entre la clase 1 y la clase 2 en la misma escuela. ^[6]^[7]^[8]

Historia y estado actual

Ronald Fisher introdujo modelos de efectos aleatorios para estudiar las correlaciones de valores de rasgos entre parientes. ^[9] En la década de 1950, Charles Roy Henderson proporcionó las mejores estimaciones lineales insesgadas de efectos fijos y las mejores predicciones lineales insesgadas de efectos aleatorios. ^[10]^[11]^[12]^[13] Posteriormente, el modelado mixto se ha convertido en un área importante de investigación estadística, incluido el trabajo sobre el cálculo de estimaciones de máxima verosimilitud, modelos de efectos mixtos no lineales, datos faltantes en modelos de efectos mixtos y modelos bayesianos. estimación de modelos de efectos mixtos. Los modelos mixtos se aplican en muchas disciplinas donde se realizan múltiples mediciones correlacionadas en cada unidad de interés. Se utilizan de manera destacada en investigaciones que involucran sujetos humanos y animales en campos que van desde la genética hasta el marketing, y también se han utilizado en el béisbol ^[14] y en las estadísticas industriales. ^[15] La asociación del modelo lineal mixto ha mejorado la prevención de asociaciones de falsos positivos. Las poblaciones están profundamente interconectadas y la estructura de relaciones de la dinámica poblacional es extremadamente difícil de modelar sin el uso de modelos mixtos. Sin embargo, es posible que los modelos lineales mixtos no sean la única solución. Los LMM tienen un supuesto de varianza residual constante que a veces se viola cuando se contabilizan o se asocian rasgos continuos y binarios profundamente. ^[dieciséis]

Definición

En notación matricial, un modelo lineal mixto se puede representar como

{\boldsymbol {y}}=X{\boldsymbol {\beta }}+Z{\boldsymbol {u}}+{\boldsymbol {\epsilon }}

dónde

${\boldsymbol {y}}$ es un vector conocido de observaciones, con media ; $E({\boldsymbol {y}})=X{\boldsymbol {\beta }}$
${\boldsymbol {\beta }}$ es un vector desconocido de efectos fijos;
${\boldsymbol {u}}$ es un vector desconocido de efectos aleatorios, con media y matriz de varianza-covarianza ; $E({\boldsymbol {u}})={\boldsymbol {0}}$ $\operatorname {var} ({\boldsymbol {u}})=G$
${\boldsymbol {\epsilon }}$ es un vector desconocido de errores aleatorios, con media y varianza ; $E({\boldsymbol {\epsilon }})={\boldsymbol {0}}$ $\operatorname {var} ({\boldsymbol {\epsilon }})=R$
$X$ es la matriz de diseño conocida para los efectos fijos que relacionan las observaciones con , respectivamente ${\boldsymbol {y}}$ ${\boldsymbol {\beta }}$
$Z$ es la matriz de diseño conocida para los efectos aleatorios que relacionan las observaciones con , respectivamente. ${\boldsymbol {y}}$ ${\boldsymbol {u}}$

Estimacion

La densidad conjunta de y se puede escribir como: . Suponiendo normalidad, y , y maximizando la densidad conjunta sobre y , se obtienen las "ecuaciones de modelos mixtos" (MME) de Henderson para modelos lineales mixtos: ^[10]^[12]^[17] ${\boldsymbol {y}}$ ${\boldsymbol {u}}$ $f({\boldsymbol {y}},{\boldsymbol {u}})=f({\boldsymbol {y}}|{\boldsymbol {u}})\,f({\boldsymbol {u}})$ ${\boldsymbol {u}}\sim {\mathcal {N}}({\boldsymbol {0}},G)$ ${\boldsymbol {\epsilon }}\sim {\mathcal {N}}({\boldsymbol {0}},R)$ $\mathrm {Cov} ({\boldsymbol {u}},{\boldsymbol {\epsilon }})={\boldsymbol {0}}$ ${\boldsymbol {\beta }}$ ${\boldsymbol {u}}$

{\begin{pmatrix}X'R^{-1}X&X'R^{-1}Z\\Z'R^{-1}X&Z'R^{-1}Z+G^{-1}\end{pmatrix}}{\begin{pmatrix}{\hat {\boldsymbol {\beta }}}\\{\hat {\boldsymbol {u}}}\end{pmatrix}}={\begin{pmatrix}X'R^{-1}{\boldsymbol {y}}\\Z'R^{-1}{\boldsymbol {y}}\end{pmatrix}}

Las soluciones del MME, y son los mejores predictores y estimaciones lineales insesgados para y , respectivamente. Esto es una consecuencia del teorema de Gauss-Markov cuando la varianza condicional del resultado no es escalable a la matriz identidad. Cuando se conoce la varianza condicional, entonces la estimación de mínimos cuadrados ponderada de la varianza inversa es la mejor estimación lineal insesgada. Sin embargo, la varianza condicional rara vez se conoce. Por lo tanto, es deseable estimar conjuntamente la varianza y las estimaciones de parámetros ponderados al resolver MME. $\textstyle {\hat {\boldsymbol {\beta }}}$ $\textstyle {\hat {\boldsymbol {u}}}$ ${\boldsymbol {\beta }}$ ${\boldsymbol {u}}$

Un método utilizado para ajustar estos modelos mixtos es el del algoritmo de maximización de expectativas (EM), donde los componentes de la varianza se tratan como parámetros molestos no observados en la probabilidad conjunta. ^[18] Actualmente, este es el método implementado en software estadístico como Python ( paquete statsmodels ) y SAS (proc mixto), y como paso inicial solo en el paquete nlme de R , lme(). La solución de las ecuaciones del modelo mixto es una estimación de máxima verosimilitud cuando la distribución de los errores es normal. ^[19]^[20]

Los efectos fijos, mixtos y aleatorios influyen en los modelos de regresión lineal.

Hay varios otros métodos para ajustar modelos mixtos, incluido el uso de un MEM inicialmente y luego Newton-Raphson (usado por lme() del paquete R nlme ^[21] ), penalizado por mínimos cuadrados para obtener una probabilidad logarítmica perfilada solo dependiendo del parámetros de varianza-covarianza (de baja dimensión) de , es decir, su matriz cov , y luego la optimización directa moderna para esa función objetivo reducida (utilizada por el paquete lme4 ^{[22] de}R lmer() y el paquete de Julia MixedModels.jl) y optimización directa de la probabilidad (utilizada, por ejemplo, por glmmTMB de R ). En particular, si bien la forma canónica propuesta por Henderson es útil para la teoría, muchos paquetes de software populares utilizan una formulación diferente para el cálculo numérico con el fin de aprovechar los métodos de matrices dispersas (por ejemplo, lme4 y MixedModels.jl). ${\boldsymbol {u}}$ ${\boldsymbol {G}}$

Ver también

Referencias

^ Baltagi, Badi H. (2008). Análisis econométrico de datos de panel (Cuarta ed.). Nueva York: Wiley. págs. 54–55. ISBN 978-0-470-51886-1.
^ ab Gomes, Dylan GE (20 de enero de 2022). "¿Debo utilizar efectos fijos o efectos aleatorios cuando tengo menos de cinco niveles de un factor de agrupación en un modelo de efectos mixtos?". PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID 35116198.
^ Yang, Jian; Zaitlén, NA; Goddard, YO; Visscher, PM; Prince, AL (29 de enero de 2014). "Ventajas y desventajas de la aplicación de métodos de asociación de modelos mixtos". Nat Genet . 46 (2): 100–106. doi :10.1038/ng.2876. PMC 3989144 . PMID 24473328.
^ ab Seltman, Howard (2016). Diseño y análisis experimental. vol. 1. págs. 357–378.
^ ab "Introducción a los modelos lineales mixtos". Métodos estadísticos informáticos de investigación avanzada y análisis de datos . Grupo de consultoría estadística de UCLA. 2021.
^ ab Kreft & de Leeuw, J. Introducción al modelado multinivel . Londres: sabio.
^ ab Raudenbush, Bryk, SW, AS (2002). Modelos lineales jerárquicos: aplicaciones y métodos de análisis de datos . Thousand Oaks, CA: Sage.{{cite book}}: CS1 maint: multiple names: authors list (link)
^ ab Snijders, Bosker, TAB, RJ (2012). Análisis multinivel: una introducción al modelado multinivel básico y avanzado . vol. 2da edición. Londres: sabio.{{cite book}}: CS1 maint: multiple names: authors list (link)
^ Pescador, RA (1918). "La correlación entre parientes bajo el supuesto de herencia mendeliana". Transacciones de la Real Sociedad de Edimburgo . 52 (2): 399–433. doi :10.1017/S0080456800012163. S2CID 181213898.
^ ab Robinson, GK (1991). "Ese BLUP es algo bueno: la estimación de efectos aleatorios". Ciencia estadística . 6 (1): 15–32. doi : 10.1214/ss/1177011926 . JSTOR 2245695.
^ CR Henderson; Óscar Kempthorne; SR Searle; CM von Krosigk (1959). "La estimación de tendencias ambientales y genéticas a partir de registros sujetos a sacrificio". Biometría . Sociedad Biométrica Internacional. 15 (2): 192–218. doi :10.2307/2527669. JSTOR 2527669.
^ ab L. Dale Van Vleck. "Charles Roy Henderson, 1 de abril de 1911 - 14 de marzo de 1989" (PDF) . Academia Nacional de Ciencias de Estados Unidos .
^ McLean, Robert A.; Sanders, William L.; Stroup, Walter W. (1991). "Un enfoque unificado para modelos lineales mixtos". El estadístico estadounidense . Asociación Estadounidense de Estadística. 45 (1): 54–64. doi :10.2307/2685241. JSTOR 2685241.
^ Anderson, RJ (2016). ""El gurú de la analítica de la MLB que podría ser el próximo Nate Silver tiene una nueva estadística revolucionaria"".
^ Obenchain, Lilly, Bob, Eli (1993). «Análisis de Datos y Visualización de Información» (PDF) . MWSUG.{{cite book}}: CS1 maint: multiple names: authors list (link)
^ Chen, H; Wang, C; Conomos, diputado; Stilp, AM; Li, Z; Más suave, T; Szpiro, AA; Chen, W; Brehm, JM; Celedón, JC; Líneas rojas; Papanicolaou, S; Thorton, GJ; Thorton, TA; Laurie, CC; Arroz, K; Lin, X (7 de abril de 2016). "Control de la estructura poblacional y la relación de rasgos binarios en estudios de asociación genética mediante modelos logísticos mixtos". Soy J Hum Genet . 98 (4): 653–666. doi :10.1016/j.ajhg.2016.02.012. PMC 4833218 . PMID 27018471.
^ Henderson, CR (1973). "Evaluación de toros y tendencias genéticas" (PDF) . Revista de ciencia animal . Sociedad Estadounidense de Ciencia Animal. 1973 : 10–41. doi : 10.1093/ansci/1973.Symposium.10 . Consultado el 17 de agosto de 2014 .
^ Lindstrom, ML; Bates, DM (1988). "Algoritmos Newton-Raphson y EM para modelos lineales de efectos mixtos para datos de medidas repetidas". Revista de la Asociación Estadounidense de Estadística . 83 (404): 1014-1021. doi :10.1080/01621459.1988.10478693.
^ Laird, Nan M.; Mercancías, James H. (1982). "Modelos de efectos aleatorios para datos longitudinales". Biometría . Sociedad Biométrica Internacional. 38 (4): 963–974. doi :10.2307/2529876. JSTOR 2529876. PMID 7168798.
^ Fitzmaurice, Garrett M.; Laird, Nan M.; Mercancías, James H. (2004). Análisis Longitudinal Aplicado . John Wiley e hijos. págs. 326–328.
^ Pinheiro, J; Bates, DM (2006). Modelos de efectos mixtos en S y S-PLUS . Estadística y Computación. Nueva York: Springer Science & Business Media. doi :10.1007/b98882. ISBN 0-387-98957-9.
^ Bates, D.; Maechler, M.; Bolker, B.; Walker, S. (2015). "Ajuste de modelos lineales de efectos mixtos utilizando lme4". Revista de software estadístico . 67 (1). doi : 10.18637/jss.v067.i01 . hdl : 2027.42/146808 .

Otras lecturas

Gałecki, Andrzej; Burzykowski, Tomasz (2013). Modelos lineales de efectos mixtos que utilizan R: un enfoque paso a paso . Nueva York: Springer. ISBN 978-1-4614-3900-4.
Milliken, Georgia; Johnson, DE (1992). Análisis de datos desordenados: vol. I. Experimentos diseñados . Nueva York: Chapman & Hall.
Oeste, BT; Welch, KB; Galecki, AT (2007). Modelos lineales mixtos: una guía práctica sobre el uso de software estadístico . Nueva York: Chapman & Hall/CRC.