En estadística , los modelos lineales generalizados jerárquicos extienden los modelos lineales generalizados al relajar el supuesto de que los componentes de error son independientes . [1] Esto permite que se construyan modelos en situaciones donde es necesario más de un término de error y también permite dependencias entre términos de error. [2] Los componentes de error pueden estar correlacionados y no necesariamente seguir una distribución normal . Cuando hay diferentes clústeres, es decir, grupos de observaciones, las observaciones en el mismo clúster están correlacionadas. De hecho, están correlacionadas positivamente porque las observaciones en el mismo clúster comparten algunas características comunes. En esta situación, usar modelos lineales generalizados e ignorar las correlaciones puede causar problemas. [3]
En un modelo jerárquico, las observaciones se agrupan en grupos y la distribución de una observación está determinada no solo por la estructura común entre todos los grupos sino también por la estructura específica del grupo al que pertenece esta observación. Por lo tanto, se introduce en el modelo un componente de efecto aleatorio, diferente para los distintos grupos. Sea la respuesta, el efecto aleatorio, la función de enlace, y es una función estrictamente monótona de . En un modelo lineal generalizado jerárquico, se debe hacer la suposición sobre y : [2] y
El predictor lineal tiene la forma:
donde es la función de enlace, , , y es una función monótona de . En este modelo lineal generalizado jerárquico, el efecto fijo se describe mediante , que es el mismo para todas las observaciones. El componente aleatorio no se observa y varía entre los grupos de forma aleatoria. Por lo tanto, toma el mismo valor para las observaciones en el mismo grupo y valores diferentes para las observaciones en grupos diferentes. [3]
La identificabilidad es un concepto de estadística . Para realizar la inferencia de parámetros, es necesario asegurarse de que se cumpla la propiedad de identificabilidad. [4] En el modelo indicado anteriormente, la ubicación de v no es identificable, ya que
Para una constante . [2] Para que el modelo sea identificable, necesitamos imponer restricciones a los parámetros. La restricción se impone generalmente a los efectos aleatorios, como . [2]
Al suponer diferentes distribuciones de y , y utilizar diferentes funciones de y ' , podremos obtener diferentes modelos. Además, el modelo lineal generalizado mixto (GLMM) es un caso especial del modelo lineal generalizado jerárquico. En los modelos lineales generalizados jerárquicos, las distribuciones de efectos aleatorios no necesariamente siguen una distribución normal . Si la distribución de es normal y la función de enlace de es la función identidad , entonces el modelo lineal generalizado jerárquico es el mismo que el GLMM. [2]
Las distribuciones de y también pueden elegirse como conjugadas, ya que se mantienen buenas propiedades y es más fácil para el cálculo y la interpretación. [2] Por ejemplo, si la distribución de es Poisson con cierta media, la distribución de es Gamma y se utiliza el enlace logit canónico, entonces llamamos al modelo Poisson conjugado modelos lineales generalizados jerárquicos. Si sigue una distribución binomial con cierta media, tiene la distribución beta conjugada y se utiliza el enlace logit canónico, entonces llamamos al modelo modelo Beta conjugado. Además, el modelo lineal mixto es el modelo lineal generalizado jerárquico conjugado normal. [2]
Un resumen de los modelos comúnmente utilizados son: [5]
Los modelos lineales generalizados jerárquicos se utilizan cuando las observaciones provienen de diferentes conglomerados. Hay dos tipos de estimadores: estimadores de efectos fijos y estimadores de efectos aleatorios, correspondientes a los parámetros en : y en , respectivamente. Hay diferentes formas de obtener estimaciones de parámetros para un modelo lineal generalizado jerárquico. Si solo son de interés los estimadores de efectos fijos, se puede utilizar el modelo promediado por población. Si la inferencia se centra en los individuos, se tendrán que predecir los efectos aleatorios. [3] Hay diferentes técnicas para ajustar un modelo lineal generalizado jerárquico.
El modelo lineal generalizado jerárquico se ha utilizado para resolver diferentes problemas de la vida real.
Por ejemplo, este método se utilizó para analizar la fabricación de semiconductores, porque los procesos interrelacionados forman una jerarquía compleja. [6] La fabricación de semiconductores es un proceso complejo que requiere diferentes procesos interrelacionados. [7] El modelo lineal generalizado jerárquico, que requiere datos agrupados, es capaz de abordar procesos complicados. Los ingenieros pueden utilizar este modelo para descubrir y analizar subprocesos importantes y, al mismo tiempo, evaluar las influencias de estos subprocesos en el rendimiento final. [6]
Los problemas de investigación de mercado también pueden analizarse mediante modelos lineales generalizados jerárquicos. Los investigadores aplicaron el modelo a los consumidores dentro de los países para resolver problemas en la estructura de datos anidados en la investigación de mercado internacional. [8]