stringtranslate.com

probabilidad empírica

En teoría de probabilidad y estadística , la verosimilitud empírica ( EL ) es un método no paramétrico para estimar los parámetros de modelos estadísticos . Requiere menos suposiciones sobre la distribución del error y al mismo tiempo conserva algunos de los méritos de la inferencia basada en la probabilidad . El método de estimación requiere que los datos sean independientes y estén distribuidos idénticamente (iid). Funciona bien incluso cuando la distribución es asimétrica o censurada . [1] Los métodos EL también pueden manejar restricciones e información previa sobre los parámetros. Art Owen fue pionero en el trabajo en esta área con su artículo de 1988. [2]

Definición

Dado un conjunto de realizaciones iid de variables aleatorias , entonces la función de distribución empírica es , con la función indicadora y las ponderaciones (normalizadas) . Entonces, la probabilidad empírica es: [3]

donde es un número pequeño (potencialmente la diferencia con la siguiente muestra más pequeña).

La estimación de probabilidad empírica se puede aumentar con información adicional mediante el uso de restricciones adicionales (similar al enfoque de ecuaciones de estimación generalizadas ) para la función de distribución empírica. Por ejemplo, se puede incorporar una restricción como la siguiente utilizando un multiplicador de Lagrange que implica .

Con restricciones similares, también podríamos modelar la correlación.

Variables aleatorias discretas

El método de verosimilitud empírica también se puede emplear para distribuciones discretas . [4] Dado que

Entonces la probabilidad empírica es nuevamente .

Utilizando el método del multiplicador lagrangiano para maximizar el logaritmo de la probabilidad empírica sujeta a la restricción de normalización trivial, encontramos un máximo. Por tanto, es la función de distribución empírica .

Procedimiento de estimación

Las estimaciones de EL se calculan maximizando la función de probabilidad empírica (ver arriba) sujeta a restricciones basadas en la función de estimación y el supuesto trivial de que los pesos de probabilidad de la función de probabilidad suman 1. [5] Este procedimiento se representa como:

sujeto a las limitaciones

[6] : Ecuación (73) 

El valor del parámetro theta se puede encontrar resolviendo la función lagrangiana

[6] : Ecuación (74) 

Existe una clara analogía entre este problema de maximización y el resuelto para la máxima entropía .

Los parámetros son parámetros molestos .

Relación de probabilidad empírica (ELR)

Se define y utiliza una función de razón de verosimilitud empírica para obtener intervalos de confianza del parámetro de interés θ similares a los intervalos de confianza paramétricos de la razón de verosimilitud. [7] [8] Sea L(F) la probabilidad empírica de la función , entonces el ELR sería:

.

Considere conjuntos de la forma

.

En tales condiciones, una prueba de rechaza cuando t no pertenece a , es decir, cuando ninguna distribución F tiene probabilidad .

El resultado central es para la media de X. Claramente, se necesitan algunas restricciones, o cuando sea . Para ver esto, dejemos:

Si es lo suficientemente pequeño y , entonces .

Pero entonces, a medida que se extiende a lo largo de , también lo hace la media de , que se traza hacia afuera . El problema se puede resolver restringiendo las distribuciones F que se admiten en un conjunto acotado. Resulta posible restringir la atención a las distribuciones t con soporte en la muestra, en otras palabras, a la distribución . Este método es conveniente ya que el estadístico podría no estar dispuesto a especificar un soporte acotado para y convierte la construcción de en un problema de dimensión finita.

Otras aplicaciones

El uso de la probabilidad empírica no se limita a los intervalos de confianza. En la regresión cuantil eficiente , un procedimiento de categorización basado en EL [9] ayuda a determinar la forma de la verdadera distribución discreta en el nivel p, y también proporciona una manera de formular un estimador consistente. Además, EL se puede utilizar en lugar de la probabilidad paramétrica para formar criterios de selección de modelos . [10] La probabilidad empírica se puede aplicar naturalmente en el análisis de supervivencia [11] o en problemas de regresión [12]

Ver también

Literatura

Referencias

  1. ^ Owen, Arte B. (2001). Probabilidad empírica. Boca Ratón, Florida ISBN 978-1-4200-3615-2. OCLC  71012491.{{cite book}}: CS1 maint: location missing publisher (link)
  2. ^ Owen, Arte B. (1988). "Intervalos de confianza del índice de verosimilitud empírico para un único funcional". Biometrika . 75 (2): 237–249. doi :10.1093/biomet/75.2.237. ISSN  0006-3444.
  3. ^ es una estimación de la densidad de probabilidad, compare el histograma
  4. ^ Wang, Dong; Chen, Song Xi (1 de febrero de 2009). "Probabilidad empírica para estimar ecuaciones con valores faltantes". Los anales de la estadística . 37 (1). arXiv : 0903.0726 . doi :10.1214/07-aos585. ISSN  0090-5364. S2CID  5427751.
  5. ^ Mittelhammer, Judge y Miller (2000), 292.
  6. ^ ab Bera, Anil K.; Bilias, Yannis (2002). "Los enfoques de estimación MM, ME, ML, EL, EF y GMM: una síntesis". Revista de Econometría . 107 (1–2): 51–86. doi :10.1016/S0304-4076(01)00113-0.
  7. ^ Owen, Arte (1 de marzo de 1990). " Regiones de confianza del índice de verosimilitud empírica ". Los anales de la estadística . 18 (1). doi : 10.1214/aos/1176347494 . ISSN  0090-5364.
  8. ^ Dong, Lauren Bin; Giles, David EA (30 de enero de 2007). "Una prueba empírica de ratio de verosimilitud para la normalidad". Comunicaciones en Estadística - Simulación y Computación . 36 (1): 197–215. doi :10.1080/03610910601096544. ISSN  0361-0918. S2CID  16866055.
  9. ^ Chen, Jien; Lazar, Nicole A. (27 de enero de 2010). "Estimación cuantil para datos discretos mediante probabilidad empírica". Revista de estadística no paramétrica . 22 (2): 237–255. doi :10.1080/10485250903301525. ISSN  1048-5252. S2CID  119684596.
  10. ^ Chen, Chixiang; Wang, Ming; Wu, Rongling; Li, Runze (2022). "Un criterio de información sólido y consistente para la selección de modelos basado en la probabilidad empírica". Estadística Sínica . arXiv : 2006.13281 . doi :10.5705/ss.202020.0254. ISSN  1017-0405. S2CID  220042083.
  11. ^ Zhou, M. (2015). Método de probabilidad empírica en el análisis de supervivencia (1ª ed.). Chapman y Hall/CRC. https://doi.org/10.1201/b18598
  12. ^ Chen, Song Xi e Ingrid Van Keilegom. "Una revisión sobre los métodos de probabilidad empírica para la regresión". PRUEBA volumen 18, páginas 415–447, (2009) https://doi.org/10.1007/s11749-009-0159-5