En estadística , un modelo lineal mixto generalizado ( GLMM ) es una extensión del modelo lineal generalizado (GLM) en el que el predictor lineal contiene efectos aleatorios además de los efectos fijos habituales . [1] [2] [3] También heredan de los modelos lineales generalizados la idea de extender los modelos lineales mixtos a datos no normales .
Los modelos lineales generalizados mixtos ofrecen una amplia gama de modelos para el análisis de datos agrupados, ya que las diferencias entre grupos pueden modelarse como un efecto aleatorio. Estos modelos son útiles en el análisis de muchos tipos de datos, incluidos los datos longitudinales . [4]
Los modelos lineales mixtos generalizados se definen generalmente de manera que, condicionados a los efectos aleatorios , la variable dependiente se distribuye según la familia exponencial con su expectativa relacionada con el predictor lineal a través de una función de enlace :
Aquí y son la matriz de diseño de efectos fijos y los efectos fijos respectivamente; y son la matriz de diseño de efectos aleatorios y los efectos aleatorios respectivamente. Para entender esta definición muy breve, primero deberá comprender la definición de un modelo lineal generalizado y de un modelo mixto .
Los modelos lineales mixtos generalizados son un caso especial de modelos lineales generalizados jerárquicos en los que los efectos aleatorios se distribuyen normalmente.
La probabilidad completa [5]
no tiene una forma cerrada general, y la integración sobre los efectos aleatorios suele ser extremadamente intensiva en términos computacionales. Además de aproximar numéricamente esta integral (por ejemplo, mediante la cuadratura de Gauss-Hermite ), se han propuesto métodos motivados por la aproximación de Laplace. [6] Por ejemplo, el método de cuasi-verosimilitud penalizada, que esencialmente implica ajustar repetidamente (es decir, doblemente iterativamente) un modelo mixto normal ponderado con una variable de trabajo, [7] se implementa en varios programas estadísticos comerciales y de código abierto.
El ajuste de modelos lineales mixtos generalizados mediante máxima verosimilitud (como a través del criterio de información de Akaike (AIC) ) implica la integración sobre los efectos aleatorios. En general, esas integrales no se pueden expresar en forma analítica . Se han desarrollado varios métodos aproximados, pero ninguno tiene buenas propiedades para todos los modelos y conjuntos de datos posibles (por ejemplo, los datos binarios no agrupados son particularmente problemáticos). Por esta razón, los métodos que involucran cuadratura numérica o Monte Carlo de cadena de Markov han aumentado en uso, ya que el aumento de la potencia de cálculo y los avances en los métodos los han hecho más prácticos.
El criterio de información de Akaike es un criterio común para la selección de modelos . Recientemente se han obtenido estimaciones del criterio de información de Akaike para modelos lineales mixtos generalizados basados en ciertas distribuciones de familias exponenciales . [8]
lme4
[11] y [12]glmm
.fitglme
función para ajustar modelos lineales mixtos generalizados.Statsmodels
admite implementaciones binomiales y de Poisson. [14]MixedModels.jl
proporciona una función llamada GeneralizedLinearMixedModel
que ajusta un modelo lineal mixto generalizado a los datos proporcionados. [15]