Se han desarrollado otros enfoques, incluidos los enfoques bayesianos y los ajustes de mínimos cuadrados a las respuestas estabilizadas de la varianza.
Esto implica que un cambio constante en un predictor conduce a un cambio constante en la variable de respuesta (es decir, un modelo de respuesta lineal).
Esto es apropiado cuando la variable de respuesta tiene una distribución normal (intuitivamente, cuando una variable de respuesta puede variar esencialmente de modo indefinido en cualquier dirección sin un "valor cero" fijo o, más generalmente, para cualquier cantidad que solo varía en una cantidad relativamente pequeña comparada con la variación en las variables predictivas, por ejemplo, la altura humana).
Por ejemplo, en los casos en que se espera que la variable de respuesta sea siempre positiva y varíe en un amplio rango, los cambios constantes de entrada conducen a cambios en los resultados o salidas que presentan variaciones geométricas (es decir, exponenciales) en lugar de variaciones constantes.
Es poco probable que este modelo se pueda generalizar bien a playas de diferentes tamaños.
Más específicamente, el problema es que si se utiliza este modelo para predecir la asistencia que habrá con una disminución de la temperatura de 10 grados en una playa que normalmente recibe 50 personas, se pronosticará una asistencia con el imposible valor de -950 personas.
Un modelo razonable podría predecir, por ejemplo, que un cambio en 10 grados hace que una persona tenga el doble de probabilidades de ir o no ir a la playa.
Es conveniente si V sigue la distribución de la familia exponencial, pero puede ser simplemente que la varianza sea una función del valor predicho.
Muchas distribuciones comunes están en esta familia, incluyendo binomial, multinomial y binomial normal, exponencial, gamma, Poisson, Bernoulli y (para un número fijo de ensayos).
Tenga en cuenta que cualquier distribución se puede convertir a una forma canónica reescribiendo
El predictor lineal es la cantidad que incorpora la información sobre las variables independientes en el modelo.
Cuando se utiliza la función de enlace canónico, b(μ) = θ = Xβ que permite que XTY sea una estadística suficiente para β.
Tenga en cuenta que si se utiliza la función de enlace canónico, entonces son iguales.
El modelo lineal general puede verse como un caso especial del modelo lineal generalizado con enlace de identidad y respuestas normalmente distribuidas.
Como los resultados de interés más exactos se obtienen solo para el modelo lineal general, el modelo lineal general ha experimentado un desarrollo histórico algo más largo.
Los resultados para el modelo lineal generalizado con enlace de no identidad son asintóticos (tienden a funcionar bien con muestras grandes).
En la regresión lineal, el uso del estimador de mínimos cuadrados se justifica por el teorema de Gauss-Markov, que no supone que la distribución sea normal.
Sin embargo, desde la perspectiva de los modelos lineales generalizados, es útil suponer que la función de distribución es la distribución normal con varianza constante y la función de enlace es la identidad, que es el enlace canónico si se conoce la varianza.
El CDF normal φ es una opción popular y produce el modelo probit.
La razón para el uso del modelo probit es que una escala constante de la variable de entrada a un CDF normal (que se puede absorber a través de la escala equivalente de todos los parámetros) produce una función que es prácticamente idéntica a la función logit, pero probit Los modelos son más manejables en algunas situaciones que los modelos logit.
(En un entorno bayesiano en el que las distribuciones anteriores normalmente distribuidas se colocan en los parámetros, la relación entre los anteriores normales y la función de enlace CDF normal significa que un modelo probit puede calcularse utilizando el muestreo de Gibbs, mientras que un modelo logit generalmente no puede).
Si p representa la proporción de observaciones con al menos un evento, su complemento
Un modelo lineal requiere que la variable de respuesta tome valores sobre toda la línea real.
El enlace de identidad g (p) = p también se usa a veces para que los datos binomiales produzcan un modelo de probabilidad lineal.
Esto se puede evitar utilizando una transformación como cloglog, probit o logit (o cualquier función de distribución acumulativa inversa).
Si τ excede de 1, se dice que el modelo exhibe una sobredispersión.
El GLM estándar asume que las observaciones no están correlacionadas.
Son adecuados cuando los efectos aleatorios y sus variaciones no son de interés inherente, ya que permiten la correlación sin explicar su origen.
Los GEE se utilizan generalmente junto con los errores estándar de Huber-White.
Los modelos aditivos generalizados (GAM) son otra extensión de los GLM en los que el predictor lineal η no está restringido a ser lineal en las covariables X, sino que es la suma de las funciones de suavizado aplicadas a la