En estadística , los métodos de cuasi-verosimilitud se utilizan para estimar parámetros en un modelo estadístico cuando los métodos de verosimilitud exacta, por ejemplo, la estimación de máxima verosimilitud , son computacionalmente inviables. Debido a que se utiliza la verosimilitud incorrecta, los estimadores de cuasi-verosimilitud pierden eficiencia asintótica en comparación con, por ejemplo, los estimadores de máxima verosimilitud. En condiciones de amplia aplicación, los estimadores de cuasi-verosimilitud son consistentes y asintóticamente normales . La matriz de covarianza asintótica se puede obtener utilizando el llamado estimador sándwich . Los ejemplos de métodos de cuasi-verosimilitud incluyen las ecuaciones de estimación generalizadas y los enfoques de verosimilitud por pares.
El término función de cuasidespereza fue introducido por Robert Wedderburn en 1974 para describir una función que tiene propiedades similares a la función de log-verosimilitud pero que no es la log-verosimilitud correspondiente a ninguna distribución de probabilidad real . [1] Propuso ajustar ciertos modelos de cuasidespereza utilizando una extensión sencilla de los algoritmos utilizados para ajustar modelos lineales generalizados .
La estimación de cuasi-verosimilitud es una forma de permitir la sobredispersión , es decir, una mayor variabilidad en los datos de la que se esperaría del modelo estadístico utilizado. Se utiliza con mayor frecuencia con modelos para datos de recuento o datos binarios agrupados, es decir, datos que de otro modo se modelarían utilizando la distribución de Poisson o binomial .
En lugar de especificar una distribución de probabilidad para los datos, solo se especifica una relación entre la media y la varianza en forma de una función de varianza que da la varianza como una función de la media. Generalmente, se permite que esta función incluya un factor multiplicativo conocido como parámetro de sobredispersión o parámetro de escala que se estima a partir de los datos. Lo más común es que la función de varianza tenga una forma tal que fijar el parámetro de sobredispersión en la unidad da como resultado la relación varianza-media de una distribución de probabilidad real, como la binomial o la de Poisson. (Para conocer las fórmulas, consulte el ejemplo de datos binomiales y el ejemplo de datos de recuento en modelos lineales generalizados ).
Los modelos de efectos aleatorios y, de manera más general, los modelos mixtos ( modelos jerárquicos ) proporcionan un método alternativo para ajustar datos que presentan sobredispersión utilizando modelos de probabilidad completamente especificados. Sin embargo, estos métodos a menudo se vuelven complejos y computacionalmente intensivos para ajustarse a datos binarios o de recuento. Los métodos de cuasi-verosimilitud tienen la ventaja de una relativa simplicidad computacional, velocidad y robustez, ya que pueden hacer uso de los algoritmos más sencillos desarrollados para ajustar modelos lineales generalizados .