stringtranslate.com

Teorema de Rao-Blackwell

En estadística , el teorema de Rao-Blackwell , a veces denominado teorema de Rao-Blackwell-Kolmogorov , es un resultado que caracteriza la transformación de un estimador arbitrariamente crudo en un estimador óptimo según el criterio del error cuadrático medio o cualquiera de una variedad de criterios similares.

El teorema de Rao-Blackwell establece que si g ( X ) es cualquier tipo de estimador de un parámetro θ, entonces la expectativa condicional de g ( X ) dada T ( X ), donde T es un estadístico suficiente , suele ser un mejor estimador de θ, y nunca es peor. A veces se puede construir muy fácilmente un estimador g ( X ) muy burdo y luego evaluar ese valor esperado condicional para obtener un estimador que sea óptimo en varios sentidos.

El teorema lleva el nombre de CR Rao y David Blackwell . El proceso de transformación de un estimador utilizando el teorema de Rao-Blackwell puede denominarse Rao-Blackwellización . El estimador transformado se llama estimador de Rao-Blackwell . [1] [2] [3]

Definiciones

En otras palabras, un estadístico suficiente T(X) para un parámetro θ es un estadístico tal que la probabilidad condicional de los datos X , dado T ( X ), no depende del parámetro θ.

el teorema

Versión de error cuadrático medio

Un caso del teorema de Rao-Blackwell establece:

El error cuadrático medio del estimador de Rao-Blackwell no excede al del estimador original.

En otras palabras,

Las herramientas esenciales de la prueba además de la definición anterior son la ley de expectativa total y el hecho de que para cualquier variable aleatoria Y , E( Y 2 ) no puede ser menor que [E( Y )] 2 . Esa desigualdad es un caso de desigualdad de Jensen , aunque también se puede demostrar que se deriva instantáneamente del hecho frecuentemente mencionado de que

Más precisamente, el error cuadrático medio del estimador de Rao-Blackwell tiene la siguiente descomposición [4]

Dado que , se sigue inmediatamente el teorema de Rao-Blackwell.

Generalización de pérdida convexa

La versión más general del teorema de Rao-Blackwell habla de la "pérdida esperada" o función de riesgo :

donde la "función de pérdida" L puede ser cualquier función convexa . Si la función de pérdida es dos veces diferenciable, como en el caso del error cuadrático medio, entonces tenemos la desigualdad más marcada [4]

Propiedades

El estimador mejorado es insesgado si y sólo si el estimador original es insesgado, como puede verse inmediatamente utilizando la ley de la expectativa total . El teorema se cumple independientemente de si se utilizan estimadores sesgados o insesgados.

El teorema parece muy débil: sólo dice que el estimador de Rao-Blackwell no es peor que el estimador original. Sin embargo, en la práctica la mejora suele ser enorme. [5]

Ejemplo

Las llamadas telefónicas llegan a una centralita según un proceso de Poisson a una velocidad promedio de λ por minuto. Esta tasa no es observable, pero sí se observan los números X 1 , ..., X n de llamadas telefónicas que llegaron durante n períodos sucesivos de un minuto. Se desea estimar la probabilidad e −λ de que el siguiente período de un minuto transcurra sin llamadas telefónicas.

Un estimador extremadamente crudo de la probabilidad deseada es

es decir, estima que esta probabilidad es 1 si no llegó ninguna llamada telefónica en el primer minuto y cero en caso contrario. A pesar de las aparentes limitaciones de este estimador, el resultado obtenido por su Rao-Blackwellización es un muy buen estimador.

La suma

Se puede demostrar fácilmente que es un estadístico suficiente para λ, es decir, la distribución condicional de los datos X 1 , ..., X n , depende de λ sólo a través de esta suma. Por tanto, encontramos el estimador de Rao-Blackwell

Después de hacer algo de álgebra tenemos

Dado que el número promedio de llamadas que llegan durante los primeros n minutos es n λ, no debería sorprendernos que este estimador tenga una probabilidad bastante alta (si n es grande) de estar cerca de

Por lo tanto, δ 1 es claramente un estimador muy mejorado de esa última cantidad. De hecho, dado que S n es completo y δ 0 es insesgado, δ 1 es el único estimador insesgado de varianza mínima según el teorema de Lehmann-Scheffé .

Idempotencia

Rao-Blackwellization es una operación idempotente . Usarlo para mejorar el estimador ya mejorado no obtiene una mejora adicional, sino que simplemente devuelve como resultado el mismo estimador mejorado.

Integridad y varianza mínima de Lehmann-Scheffé

Si el estadístico condicionante es completo y suficiente , y el estimador inicial es insesgado, entonces el estimador de Rao-Blackwell es el único " mejor estimador insesgado ": véase el teorema de Lehmann-Scheffé .

Galili y Meilijson proporcionaron en 2016 un ejemplo de una mejora de Rao-Blackwell mejorable, cuando se utiliza una estadística mínima suficiente que no es completa . [6] Sea una muestra aleatoria de una distribución de escala uniforme con media desconocida y diseño conocido. parámetro . En la búsqueda de los "mejores" estimadores insesgados posibles, es natural considerarlo como un estimador insesgado inicial (crudo) y luego intentar mejorarlo. Dado que no es una función de , el estadístico mínimo suficiente para (donde y ), se puede mejorar utilizando el teorema de Rao-Blackwell de la siguiente manera:

Sin embargo, se puede demostrar que el siguiente estimador insesgado tiene una varianza menor:

Y de hecho, podría mejorarse aún más si se utiliza el siguiente estimador:

El modelo es un modelo a escala . Luego se pueden derivar estimadores equivariantes óptimos para funciones de pérdida que son invariantes . [7]

Ver también

Referencias

  1. ^ Blackwell, D. (1947). "Expectativa condicional y estimación secuencial insesgada". Anales de estadística matemática . 18 (1): 105–110. doi : 10.1214/aoms/1177730497 . Señor  0019903. Zbl  0033.07603.
  2. ^ Kolmogorov, AN (1950). "Estimaciones imparciales". Izvestia Akad. Nauk SSSR. Ser. Estera . 14 : 303–326. SEÑOR  0036479.
  3. ^ Rao, C. Radhakrishna (1945). "Información y precisión alcanzables en la estimación de parámetros estadísticos". Boletín de la Sociedad Matemática de Calcuta . 37 (3): 81–91.
  4. ^ ab JG Liao; A. Berg (22 de junio de 2018). "Agudizando la desigualdad de Jensen". El estadístico estadounidense . 73 (3): 278–281. arXiv : 1707.08644 . doi :10.1080/00031305.2017.1419145. S2CID  88515366.
  5. ^ Carpintero, Bob (20 de enero de 2020). "Rao-Blackwellización y parámetros discretos en Stan". Modelado estadístico, inferencia causal y ciencias sociales . Consultado el 13 de septiembre de 2021 . El teorema de Rao-Blackwell establece que el enfoque de marginación tiene una varianza menor o igual que el enfoque directo. En la práctica, esta diferencia puede ser enorme.
  6. ^ Tal Galili; Isaac Meilijson (31 de marzo de 2016). "Un ejemplo de una mejora Rao-Blackwell mejorable, un estimador de máxima verosimilitud ineficiente y un estimador de Bayes generalizado imparcial". El estadístico estadounidense . 70 (1): 108-113. doi :10.1080/00031305.2015.1100683. PMC 4960505 . PMID  27499547. 
  7. ^ Taraldsen, Gunnar (2020). "Micha Mandel (2020)," El modelo uniforme a escala revisitado ", The American Statistician, 74: 1, 98-100: comentario". El estadístico estadounidense . 74 (3): 315. doi :10.1080/00031305.2020.1769727. ISSN  0003-1305. S2CID  219493070.

enlaces externos