stringtranslate.com

estadística U

En teoría estadística , una estadística U es una clase de estadística definida como el promedio de la aplicación de una función determinada aplicada a todas las tuplas de un tamaño fijo. La letra "U" significa imparcial. En estadística elemental, las estadísticas U surgen naturalmente al producir estimadores insesgados de varianza mínima .

La teoría de la estadística U permite derivar un estimador insesgado de varianza mínima a partir de cada estimador insesgado de un parámetro estimable (alternativamente, funcional estadístico ) para grandes clases de distribuciones de probabilidad . [1] [2] Un parámetro estimable es una función medible de la distribución de probabilidad acumulada de la población : por ejemplo, para cada distribución de probabilidad, la mediana de la población es un parámetro estimable. La teoría de la estadística U se aplica a clases generales de distribuciones de probabilidad.

Historia

Muchas estadísticas derivadas originalmente para familias paramétricas particulares han sido reconocidas como estadísticas U para distribuciones generales. En estadística no paramétrica , la teoría de la estadística U se utiliza para establecer procedimientos estadísticos (como estimadores y pruebas) y estimadores relacionados con la normalidad asintótica y con la varianza (en muestras finitas) de tales cantidades. [3] La teoría se ha utilizado para estudiar estadísticas más generales, así como procesos estocásticos , como gráficos aleatorios . [4] [5] [6]

Supongamos que un problema involucra variables aleatorias independientes y distribuidas de manera idéntica y que se requiere la estimación de un determinado parámetro. Supongamos que se puede construir una estimación insesgada simple basada en sólo unas pocas observaciones: esto define el estimador básico basado en un número determinado de observaciones. Por ejemplo, una sola observación es en sí misma una estimación insesgada de la media y se pueden utilizar un par de observaciones para derivar una estimación insesgada de la varianza. El estadístico U basado en este estimador se define como el promedio (de todas las selecciones combinatorias del tamaño dado del conjunto completo de observaciones) del estimador básico aplicado a las submuestras.

Pranab K. Sen (1992) proporciona una revisión del artículo de Wassily Hoeffding (1948), que introdujo las estadísticas U y expuso la teoría relacionada con ellas, y al hacerlo, Sen describe la importancia que tienen las estadísticas U en la teoría estadística. Sen dice: [7] “El impacto de Hoeffding (1948) es abrumador en la actualidad y es muy probable que continúe en los años venideros”. Tenga en cuenta que la teoría de la estadística U no se limita a [8] el caso de variables aleatorias independientes e idénticamente distribuidas o a variables aleatorias escalares. [9]

Definición

El término estadístico U, debido a Hoeffding (1948), se define de la siguiente manera.

Sean números reales o complejos, y sea una función valorada de variables dimensionales. Para cada uno, el estadístico U asociado se define como el promedio de los valores sobre el conjunto de tuplas de índices con entradas distintas. Formalmente,

.

En particular, si es simétrico lo anterior se simplifica a

,

donde ahora denota el subconjunto de tuplas crecientes .

Cada estadístico U es necesariamente una función simétrica .

Las estadísticas U son muy naturales en el trabajo estadístico, particularmente en el contexto de Hoeffding de variables aleatorias independientes e idénticamente distribuidas , o más generalmente para secuencias intercambiables , como en el muestreo aleatorio simple de una población finita, donde la propiedad definitoria se denomina "herencia en la promedio'.

El estadístico k de Fisher y los polikays de Tukey son ejemplos de estadístico U polinomial homogéneo (Fisher, 1929; Tukey, 1950).

Para una muestra aleatoria simple φ de tamaño  n tomada de una población de tamaño  N , el estadístico U tiene la propiedad de que el promedio de los valores muestrales  ƒ n ( ) es exactamente igual al valor poblacional  ƒ N ( x ). [ se necesita aclaración ]

Ejemplos

Algunos ejemplos: Si el estadístico U es la media muestral.

Si , el estadístico U es la desviación media por pares , definida para .

Si , el estadístico U es la varianza muestral con divisor , definida para .

El tercer estadístico , la asimetría muestral definida para , es un estadístico U.

El siguiente caso resalta un punto importante. Si es la mediana de tres valores, no es la mediana de valores. Sin embargo, es una estimación insesgada de varianza mínima del valor esperado de la mediana de tres valores, no la mediana de la población. Estimaciones similares desempeñan un papel central cuando los parámetros de una familia de distribuciones de probabilidad se estiman mediante momentos ponderados de probabilidad o momentos L.

Ver también

Notas

  1. ^ Cox y Hinkley (1974), pág. 200, pág. 258
  2. ^ Hoeffding (1948), entre las ecuaciones (4.3), (4.4)
  3. ^ Sen (1992)
  4. ^ Página 508 en Koroljuk, VS; Borovskich, Yu. V. (1994). Teoría de la estadística U. Matemáticas y sus Aplicaciones. vol. 273 (Traducido por PV Malyshev y DV Malyshev de la edición original rusa de 1989). Dordrecht: Grupo de editores académicos de Kluwer. págs.x+552. ISBN 0-7923-2608-3. SEÑOR  1472486.
  5. ^ Páginas 381–382 en Borovskikh, Yu. V. (1996).Estadísticos U en espacios de Banach . Utrecht: VSP. págs. xii+420. ISBN 90-6764-200-2. SEÑOR  1419498.
  6. ^ Página xii en Kwapień, Stanisƚaw; Woyczyński, Wojbor A. (1992). Series aleatorias e integrales estocásticas: simples y múltiples . Probabilidad y sus aplicaciones. Boston, MA: Birkhäuser Boston, Inc. págs. xvi+360. ISBN 0-8176-3572-6. SEÑOR  1167198.
  7. ^ Sen (1992) pág. 307
  8. ^ Sen (1992), p306
  9. ^ El último capítulo de Borovskikh analiza las estadísticas U para elementos aleatorios intercambiables que toman valores en un espacio vectorial ( espacio de Banach separable ).

Referencias