Modelo lineal generalizado jerárquico

En estadística , los modelos lineales generalizados jerárquicos extienden los modelos lineales generalizados al relajar el supuesto de que los componentes de error son independientes . ^[1] Esto permite que se construyan modelos en situaciones donde es necesario más de un término de error y también permite dependencias entre términos de error. ^[2] Los componentes de error pueden estar correlacionados y no necesariamente seguir una distribución normal . Cuando hay diferentes clústeres, es decir, grupos de observaciones, las observaciones en el mismo clúster están correlacionadas. De hecho, están correlacionadas positivamente porque las observaciones en el mismo clúster comparten algunas características comunes. En esta situación, usar modelos lineales generalizados e ignorar las correlaciones puede causar problemas. ^[3]

Descripción general y modelo

Modelo

En un modelo jerárquico, las observaciones se agrupan en grupos y la distribución de una observación está determinada no solo por la estructura común entre todos los grupos sino también por la estructura específica del grupo al que pertenece esta observación. Por lo tanto, se introduce en el modelo un componente de efecto aleatorio, diferente para los distintos grupos. Sea la respuesta, el efecto aleatorio, la función de enlace, y es una función estrictamente monótona de . En un modelo lineal generalizado jerárquico, se debe hacer la suposición sobre y : ^[2] y ${\estilo de visualización y}$ ${\estilo de visualización u}$ ${\estilo de visualización g}$ $\eta = X\beta$ $v=v(u)$ ${\estilo de visualización u}$ $y|u$ ${\estilo de visualización u}$ $y\mid u\sim \ f(\theta ,\,\phi )$ $u\sim \ f_{u}(\alpha ).$

El predictor lineal tiene la forma:

g(E(y))=g(\mu )=\eta =X\beta +v\,

donde es la función de enlace, , , y es una función monótona de . En este modelo lineal generalizado jerárquico, el efecto fijo se describe mediante , que es el mismo para todas las observaciones. El componente aleatorio no se observa y varía entre los grupos de forma aleatoria. Por lo tanto, toma el mismo valor para las observaciones en el mismo grupo y valores diferentes para las observaciones en grupos diferentes. ^[3] $g$ $\mu =E(y)$ $\eta =X\beta +v$ $v=v(u)$ $u$ $\beta$ $u$ $v$

Identificabilidad

La identificabilidad es un concepto de estadística . Para realizar la inferencia de parámetros, es necesario asegurarse de que se cumpla la propiedad de identificabilidad. ^[4] En el modelo indicado anteriormente, la ubicación de v no es identificable, ya que

X\beta +v=(X\beta +a)+(v-a)\,

Para una constante . ^[2] Para que el modelo sea identificable, necesitamos imponer restricciones a los parámetros. La restricción se impone generalmente a los efectos aleatorios, como . ^[2] $a$ $E(v)=0$

Modelos con diferentes distribuciones y funciones de enlace

Al suponer diferentes distribuciones de y , y utilizar diferentes funciones de y ' , podremos obtener diferentes modelos. Además, el modelo lineal generalizado mixto (GLMM) es un caso especial del modelo lineal generalizado jerárquico. En los modelos lineales generalizados jerárquicos, las distribuciones de efectos aleatorios no necesariamente siguen una distribución normal . Si la distribución de es normal y la función de enlace de es la función identidad , entonces el modelo lineal generalizado jerárquico es el mismo que el GLMM. ^[2] $y\mid u$ $u$ $g$ $v$ $u$ $u$ $v$

Las distribuciones de y también pueden elegirse como conjugadas, ya que se mantienen buenas propiedades y es más fácil para el cálculo y la interpretación. ^[2] Por ejemplo, si la distribución de es Poisson con cierta media, la distribución de es Gamma y se utiliza el enlace logit canónico, entonces llamamos al modelo Poisson conjugado modelos lineales generalizados jerárquicos. Si sigue una distribución binomial con cierta media, tiene la distribución beta conjugada y se utiliza el enlace logit canónico, entonces llamamos al modelo modelo Beta conjugado. Además, el modelo lineal mixto es el modelo lineal generalizado jerárquico conjugado normal. ^[2] $y\mid u$ $u$ $y\mid u$ $u$ $y\mid u$ $u$

Un resumen de los modelos comúnmente utilizados son: ^[5]

Ajuste de los modelos lineales generalizados jerárquicos

Los modelos lineales generalizados jerárquicos se utilizan cuando las observaciones provienen de diferentes conglomerados. Hay dos tipos de estimadores: estimadores de efectos fijos y estimadores de efectos aleatorios, correspondientes a los parámetros en : y en , respectivamente. Hay diferentes formas de obtener estimaciones de parámetros para un modelo lineal generalizado jerárquico. Si solo son de interés los estimadores de efectos fijos, se puede utilizar el modelo promediado por población. Si la inferencia se centra en los individuos, se tendrán que predecir los efectos aleatorios. ^[3] Hay diferentes técnicas para ajustar un modelo lineal generalizado jerárquico. $\eta =\mathbf {x} {\boldsymbol {\beta }}$ $\mathbf {v(u)}$

Ejemplos y aplicaciones

El modelo lineal generalizado jerárquico se ha utilizado para resolver diferentes problemas de la vida real.

Ingeniería

Por ejemplo, este método se utilizó para analizar la fabricación de semiconductores, porque los procesos interrelacionados forman una jerarquía compleja. ^[6] La fabricación de semiconductores es un proceso complejo que requiere diferentes procesos interrelacionados. ^[7] El modelo lineal generalizado jerárquico, que requiere datos agrupados, es capaz de abordar procesos complicados. Los ingenieros pueden utilizar este modelo para descubrir y analizar subprocesos importantes y, al mismo tiempo, evaluar las influencias de estos subprocesos en el rendimiento final. ^[6]

Negocio

Los problemas de investigación de mercado también pueden analizarse mediante modelos lineales generalizados jerárquicos. Los investigadores aplicaron el modelo a los consumidores dentro de los países para resolver problemas en la estructura de datos anidados en la investigación de mercado internacional. ^[8]

Referencias

^ Modelos lineales generalizados . Chapman y Hall/CRC. 1989. ISBN 0-412-31760-5.
^ abcdefg Y. Lee; JA Nelder (1996). "Modelos lineales generalizados jerárquicos". Revista de la Royal Statistical Society, Serie B . 58 (4): 619–678. JSTOR 2346105.
^ abc Agresti, Alan (2002). Análisis de datos categóricos . Hoboken, Nueva Jersey: John Wiley & Sons, Inc. ISBN 0-471-36093-7.
^ Allman, Elizabeth S. ; Matias, Catherine; Rhodes, John A. (2009). "Identificabilidad de parámetros en modelos de estructura latente con muchas variables observadas". Anales de estadística . 37, núm. 6A (6A): 3099–3132. arXiv : 0809.5032 . Código Bibliográfico :2008arXiv0809.5032A. doi :10.1214/09-AOS689. S2CID 16738108.
^ Lars Rönnegård; Xia Shen; Moudud Alam (diciembre de 2010). "hglm: un paquete para ajustar modelos lineales generalizados jerárquicos". The R Journal . 2/2 .
^ ab Naveen Kumar; Christina Mastrangelo; Doug Montgomery (2011). "Modelado jerárquico mediante modelos lineales generalizados". Ingeniería de calidad y confiabilidad internacional .
^ Chung Kwan Shin; Sang Chan Park (2000). "Un enfoque de aprendizaje automático para la gestión del rendimiento en la fabricación de semiconductores". Revista internacional de investigación de producción . 38 (17): 4261–4271. doi :10.1080/00207540050205073. S2CID 111295634.
^ Burcu Tasoluk; Cornelia Dröge; Roger J. Calantone (2011). "Interpretación de interrelaciones en múltiples niveles en modelos HGLM: una aplicación en la investigación de marketing internacional". International Marketing Review . 28 (1): 34–56. doi :10.1108/02651331111107099.