En teoría estadística , una pseudoverosimilitud es una aproximación a la distribución de probabilidad conjunta de una colección de variables aleatorias . El uso práctico de esto es que puede proporcionar una aproximación a la función de verosimilitud de un conjunto de datos observados, lo que puede proporcionar un problema computacionalmente más simple para la estimación o puede proporcionar una forma de obtener estimaciones explícitas de los parámetros del modelo.
El enfoque de pseudoverosimilitud fue introducido por Julian Besag [1] en el contexto del análisis de datos que tienen dependencia espacial .
Definición
Dado un conjunto de variables aleatorias la pseudoverosimilitud de es
en caso discreto y
en uno continuo. Aquí hay un vector de variables, es un vector de valores, es densidad condicional y es el vector de parámetros que vamos a estimar. La expresión anterior significa que cada variable en el vector tiene un valor correspondiente en el vector y significa que se ha omitido la coordenada . La expresión es la probabilidad de que el vector de variables tenga valores iguales al vector . Esta probabilidad, por supuesto, depende del parámetro desconocido . Debido a que las situaciones a menudo se pueden describir utilizando variables de estado que abarcan un conjunto de valores posibles, la expresión puede representar la probabilidad de un cierto estado entre todos los estados posibles permitidos por las variables de estado.
La pseudo-logaritmo de verosimilitud es una medida similar derivada de la expresión anterior, es decir (en el caso discreto)
Un uso de la medida de pseudoverosimilitud es como aproximación para la inferencia sobre una red de Markov o Bayesiana , ya que la pseudoverosimilitud de una asignación a menudo puede calcularse de manera más eficiente que la probabilidad, particularmente cuando esta última puede requerir marginalización sobre un gran número de variables.
Propiedades
El uso de la pseudoverosimilitud en lugar de la función de verosimilitud verdadera en un análisis de máxima verosimilitud puede conducir a buenas estimaciones, pero una aplicación directa de las técnicas de verosimilitud habituales para derivar información sobre la incertidumbre de la estimación, o para pruebas de significancia , sería en general incorrecta. [2]
Referencias
- ^ Besag, J. (1975), "Análisis estadístico de datos no reticulares", The Statistician , 24 (3): 179–195, doi :10.2307/2987782, JSTOR 2987782
- ^ Dodge, Y. (2003) The Oxford Dictionary of Statistical Terms , Oxford University Press. ISBN 0-19-920613-9 [ cita completa necesaria ]