stringtranslate.com

Modelo mixto

Un modelo mixto , modelo de efectos mixtos o modelo de componentes de error mixto es un modelo estadístico que contiene tanto efectos fijos como efectos aleatorios . [1] [2] Estos modelos son útiles en una amplia variedad de disciplinas en las ciencias físicas, biológicas y sociales. Son particularmente útiles en entornos donde se realizan mediciones repetidas en las mismas unidades estadísticas (ver también estudio longitudinal ), o donde las mediciones se realizan en grupos de unidades estadísticas relacionadas. [2] Los modelos mixtos a menudo se prefieren a los modelos de regresión de análisis de varianza tradicionales porque no se basan en el supuesto de observaciones independientes. Además, tienen su flexibilidad para tratar los valores faltantes y el espaciado desigual de las mediciones repetidas. [3] El análisis del modelo mixto permite que las mediciones se modelen explícitamente en una variedad más amplia de estructuras de correlación y varianza - covarianza evitando estimaciones sesgadas .

En esta página se analizarán principalmente modelos lineales de efectos mixtos en lugar de modelos lineales mixtos generalizados o modelos no lineales de efectos mixtos . [4]

Descripción cualitativa

Los modelos lineales mixtos (LMM) son modelos estadísticos que incorporan efectos fijos y aleatorios para representar con precisión estructuras de datos no independientes. Los LMM son una alternativa al análisis de varianza . A menudo, el ANOVA supone la independencia de las observaciones dentro de cada grupo; sin embargo, esta suposición puede no ser válida en datos no independientes, como conjuntos de datos multinivel/ jerárquicos , longitudinales o correlacionados .

Los conjuntos no independientes son aquellos en los que la variabilidad entre los resultados se debe a correlaciones dentro de los grupos o entre grupos. Los modelos mixtos dan cuenta adecuadamente de las estructuras de anidación /estructuras de datos jerárquicas donde las observaciones se ven influenciadas por sus asociaciones anidadas. Por ejemplo, al estudiar métodos educativos que involucran múltiples escuelas, hay múltiples niveles de variables a considerar. El nivel individual/nivel inferior comprende estudiantes o maestros individuales dentro de la escuela. Las observaciones obtenidas de este estudiante/maestro están anidadas dentro de su escuela. Por ejemplo, el Estudiante A es una unidad dentro de la Escuela A. El siguiente nivel superior es la escuela. En el nivel superior, la escuela contiene múltiples estudiantes y maestros individuales. El nivel de la escuela influye en las observaciones obtenidas de los estudiantes y maestros. Por ejemplo, la Escuela A y la Escuela B son los niveles superiores, cada uno con su conjunto de Estudiante A y Estudiante B respectivamente. Esto representa un esquema de datos jerárquico. Una solución para modelar datos jerárquicos es usar modelos mixtos lineales.

Representación de cómo los datos relacionados con el sistema educativo no son independientes y están estructurados en niveles anidados/jerárquicos.

Los LMM nos permiten comprender los efectos importantes entre y dentro de los niveles al tiempo que incorporan las correcciones para los errores estándar por no independencia incorporadas en la estructura de datos. [4] [5]

El efecto fijo

Los efectos fijos encapsulan las tendencias que son consistentes en los niveles de interés primario. Estos efectos se consideran fijos porque no son aleatorios y se supone que son constantes para la población en estudio. [5] Por ejemplo, al estudiar la educación, un efecto fijo podría representar efectos generales a nivel escolar que sean consistentes en todas las escuelas.

Si bien la jerarquía del conjunto de datos suele ser obvia, se deben especificar los efectos fijos específicos que afectan las respuestas promedio de todos los sujetos. Algunos coeficientes de efectos fijos son suficientes sin los efectos aleatorios correspondientes, mientras que otros coeficientes fijos solo representan un promedio en el que las unidades individuales son aleatorias. Estos se pueden determinar incorporando interceptos y pendientes aleatorios . [6] [7] [8]

En la mayoría de las situaciones se consideran varios modelos relacionados y se adopta el modelo que mejor representa un modelo universal.

El efecto aleatorio, ε

Un componente clave del modelo mixto es la incorporación de efectos aleatorios con el efecto fijo. Los efectos fijos se ajustan a menudo para representar el modelo subyacente. En los modelos mixtos lineales, la verdadera regresión de la población es lineal, β. Los datos fijos se ajustan en el nivel más alto. Los efectos aleatorios introducen variabilidad estadística en diferentes niveles de la jerarquía de datos. Estos dan cuenta de las fuentes de varianza no medidas que afectan a ciertos grupos en los datos. Por ejemplo, las diferencias entre el estudiante 1 y el estudiante 2 en la misma clase, o las diferencias entre la clase 1 y la clase 2 en la misma escuela.   [6] [7] [8]

Historia y estado actual

Representación de datos sesgados vs. no sesgados y las diferencias entre las estimaciones ajustadas utilizando regresión de mínimos cuadrados (LSR) y un modelo lineal mixto (LMM).

Ronald Fisher introdujo los modelos de efectos aleatorios para estudiar las correlaciones de los valores de los rasgos entre parientes. [9] En la década de 1950, Charles Roy Henderson proporcionó las mejores estimaciones lineales imparciales de los efectos fijos y las mejores predicciones lineales imparciales de los efectos aleatorios. [10] [11] [12] [13] Posteriormente, el modelado mixto se ha convertido en un área importante de la investigación estadística, incluido el trabajo sobre el cálculo de estimaciones de máxima verosimilitud, modelos de efectos mixtos no lineales, datos faltantes en modelos de efectos mixtos y estimación bayesiana de modelos de efectos mixtos. Los modelos mixtos se aplican en muchas disciplinas donde se realizan múltiples mediciones correlacionadas en cada unidad de interés. Se utilizan de forma destacada en la investigación que involucra a sujetos humanos y animales en campos que van desde la genética hasta el marketing, y también se han utilizado en el béisbol [14] y las estadísticas industriales. [15] La asociación del modelo lineal mixto ha mejorado la prevención de asociaciones de falsos positivos. Las poblaciones están profundamente interconectadas y la estructura de parentesco de la dinámica poblacional es extremadamente difícil de modelar sin el uso de modelos mixtos. Sin embargo, los modelos lineales mixtos pueden no ser la única solución. Los LMM tienen un supuesto de varianza residual constante que a veces se viola cuando se contabilizan o asocian profundamente rasgos continuos y binarios . [16]

Definición

En notación matricial, un modelo lineal mixto se puede representar como

dónde

Por ejemplo, si cada observación puede pertenecer a cero o más de k categorías, entonces Z , que tiene una fila por observación, puede elegirse para tener k columnas, donde un valor de 1 para un elemento de matriz de Z indica que se sabe que una observación pertenece a una categoría y un valor de 0 indica que se sabe que una observación no pertenece a una categoría. El valor inferido de u para una categoría es entonces una intersección específica de la categoría . Si Z tiene columnas adicionales, donde los valores distintos de cero son en cambio el valor de una variable independiente para una observación, entonces el valor inferido correspondiente de u es una pendiente específica de la categoría para esa variable independiente. La distribución previa para las intersecciones y pendientes de la categoría se describe mediante la matriz de covarianza G .

Estimación

La densidad conjunta de y se puede escribir como: . Suponiendo normalidad, , y , y maximizando la densidad conjunta sobre y , se obtienen las "ecuaciones de modelo mixto" (MME) de Henderson para modelos mixtos lineales: [10] [12] [17]

donde por ejemplo X′ es la matriz transpuesta de X y R −1 es la matriz inversa de R .

Las soluciones de la MME, y son las mejores estimaciones lineales imparciales y predictores para y , respectivamente. Esto es una consecuencia del teorema de Gauss-Markov cuando la varianza condicional del resultado no es escalable a la matriz identidad. Cuando se conoce la varianza condicional, entonces la estimación de mínimos cuadrados ponderada por la varianza inversa es la mejor estimación lineal imparcial. Sin embargo, la varianza condicional rara vez, o nunca, se conoce. Por lo tanto, es deseable estimar conjuntamente la varianza y las estimaciones de los parámetros ponderados al resolver MME.

Un método utilizado para ajustar estos modelos mixtos es el del algoritmo de expectativa-maximización (EM), donde los componentes de varianza se tratan como parámetros de molestia no observados en la verosimilitud conjunta. [18] Actualmente, este es el método implementado en software estadístico como Python (paquete statsmodels) y SAS (proc mixed), y como paso inicial solo en el paquete nlme de R lme(). La solución a las ecuaciones del modelo mixto es una estimación de máxima verosimilitud cuando la distribución de los errores es normal. [19] [20]

Los efectos fijos, mixtos y aleatorios influyen en los modelos de regresión lineal.

Existen otros métodos para ajustar modelos mixtos, incluido el uso de un modelo de efectos mixtos (MEM) inicialmente, y luego Newton-Raphson (usado por lme() del paquete nlme [21] de R ), mínimos cuadrados penalizados para obtener una verosimilitud perfilada solo dependiendo de los parámetros de varianza-covarianza (de baja dimensión) de , es decir, su matriz cov , y luego la optimización directa moderna para esa función objetivo reducida (usada por el paquete lmer() de lme4 [22] de R y el paquete de Julia MixedModels.jl) y la optimización directa de la verosimilitud (usada por, por ejemplo, glmmTMB de R ). En particular, si bien la forma canónica propuesta por Henderson es útil para la teoría, muchos paquetes de software populares usan una formulación diferente para el cálculo numérico con el fin de aprovechar los métodos de matriz dispersa (por ejemplo, lme4 y MixedModels.jl).

Véase también

Referencias

  1. ^ Baltagi, Badi H. (2008). Análisis econométrico de datos de panel (cuarta edición). Nueva York: Wiley. pp. 54-55. ISBN 978-0-470-51886-1.
  2. ^ ab Gomes, Dylan GE (20 de enero de 2022). "¿Debo utilizar efectos fijos o efectos aleatorios cuando tengo menos de cinco niveles de un factor de agrupamiento en un modelo de efectos mixtos?". PeerJ . 10 : e12794. doi : 10.7717/peerj.12794 . PMC 8784019 . PMID  35116198. 
  3. ^ Yang, Jian; Zaitlén, NA; Goddard, YO; Visscher, PM; Prince, AL (29 de enero de 2014). "Ventajas y desventajas de la aplicación de métodos de asociación de modelos mixtos". Nat Genet . 46 (2): 100–106. doi :10.1038/ng.2876. PMC 3989144 . PMID  24473328. 
  4. ^ ab Seltman, Howard (2016). Diseño y análisis experimental. Vol. 1. págs. 357–378.
  5. ^ ab "Introducción a los modelos lineales mixtos". Métodos estadísticos y análisis de datos para computación de investigación avanzada . Grupo de consultoría estadística de la UCLA. 2021.
  6. ^ ab Kreft & de Leeuw, J. Introducción al modelado multinivel . Londres: sabio.
  7. ^ ab Raudenbush, Bryk, SW, AS (2002). Modelos lineales jerárquicos: aplicaciones y métodos de análisis de datos . Thousand Oaks, CA: Sage.{{cite book}}: CS1 maint: multiple names: authors list (link)
  8. ^ ab Snijders, Bosker, TAB, RJ (2012). Análisis multinivel: Una introducción al modelado multinivel básico y avanzado . Vol. 2.ª edición. Londres: Sage.{{cite book}}: CS1 maint: multiple names: authors list (link)
  9. ^ Fisher, RA (1918). "La correlación entre parientes en el supuesto de herencia mendeliana". Transactions of the Royal Society of Edinburgh . 52 (2): 399–433. doi :10.1017/S0080456800012163. S2CID  181213898.
  10. ^ ab Robinson, GK (1991). "Que BLUP es algo bueno: la estimación de efectos aleatorios". Ciencia estadística . 6 (1): 15–32. doi : 10.1214/ss/1177011926 . JSTOR  2245695.
  11. ^ CR Henderson; Oscar Kempthorne; SR Searle; CM von Krosigk (1959). "La estimación de tendencias ambientales y genéticas a partir de registros sujetos a selección selectiva". Biometrics . 15 (2). International Biometric Society: 192–218. doi :10.2307/2527669. JSTOR  2527669.
  12. ^ ab L. Dale Van Vleck. «Charles Roy Henderson, 1 de abril de 1911 – 14 de marzo de 1989» (PDF) . Academia Nacional de Ciencias de los Estados Unidos .
  13. ^ McLean, Robert A.; Sanders, William L.; Stroup, Walter W. (1991). "Un enfoque unificado para los modelos lineales mixtos". The American Statistician . 45 (1). Asociación Estadounidense de Estadística: 54–64. doi :10.2307/2685241. JSTOR  2685241.
  14. ^ Anderson, RJ (2016). "El gurú del análisis de la MLB que podría ser el próximo Nate Silver tiene una nueva estadística revolucionaria".
  15. ^ Obenchain, Lilly, Bob, Eli (1993). "Análisis de datos y visualización de información" (PDF) . MWSUG.{{cite book}}: CS1 maint: multiple names: authors list (link)
  16. ^ Chen, H; Wang, C; Conomos, MP; Stilp, AM; Li, Z; Sofer, T; Szpiro, AA; Chen, W; Brehm, JM; Celedon, JC; Redline, S; Papanicolaou, S; Thorton, GJ; Thorton, TA; Laurie, CC; Rice, K; Lin, X (7 de abril de 2016). "Control de la estructura de la población y la relación para rasgos binarios en estudios de asociación genética mediante modelos logísticos mixtos". Am J Hum Genet . 98 (4): 653–666. doi :10.1016/j.ajhg.2016.02.012. PMC 4833218 . PMID  27018471. 
  17. ^ Henderson, CR (1973). "Evaluación de sementales y tendencias genéticas" (PDF) . Journal of Animal Science . 1973. American Society of Animal Science: 10–41. doi :10.1093/ansci/1973.Symposium.10 . Consultado el 17 de agosto de 2014 .
  18. ^ Lindstrom, ML; Bates, DM (1988). "Algoritmos Newton-Raphson y EM para modelos lineales de efectos mixtos para datos de medidas repetidas". Revista de la Asociación Estadounidense de Estadística . 83 (404): 1014–1021. doi :10.1080/01621459.1988.10478693.
  19. ^ Laird, Nan M.; Ware, James H. (1982). "Modelos de efectos aleatorios para datos longitudinales". Biometría . 38 (4). Sociedad Biométrica Internacional: 963–974. doi :10.2307/2529876. JSTOR  2529876. PMID  7168798.
  20. ^ Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Análisis longitudinal aplicado . John Wiley & Sons. págs. 326–328.
  21. ^ Pinheiro, J; Bates, DM (2006). Modelos de efectos mixtos en S y S-PLUS . Estadística y computación. Nueva York: Springer Science & Business Media. doi :10.1007/b98882. ISBN. 0-387-98957-9.
  22. ^ Bates, D.; Maechler, M.; Bolker, B.; Walker, S. (2015). "Ajuste de modelos lineales de efectos mixtos utilizando lme4". Journal of Statistical Software . 67 (1). doi : 10.18637/jss.v067.i01 . hdl : 2027.42/146808 .

Lectura adicional