Clase de estadística en la teoría de la estimación.
En teoría estadística , una estadística U es una clase de estadística definida como el promedio de la aplicación de una función determinada aplicada a todas las tuplas de un tamaño fijo. La letra "U" significa imparcial. En estadística elemental, las estadísticas U surgen naturalmente al producir estimadores insesgados de varianza mínima .
La teoría de la estadística U permite derivar un estimador insesgado de varianza mínima a partir de cada estimador insesgado de un parámetro estimable (alternativamente, funcional estadístico ) para grandes clases de distribuciones de probabilidad . [1] [2] Un parámetro estimable es una función medible de la distribución de probabilidad acumulada de la población : por ejemplo, para cada distribución de probabilidad, la mediana de la población es un parámetro estimable. La teoría de la estadística U se aplica a clases generales de distribuciones de probabilidad.
Historia
Muchas estadísticas derivadas originalmente para familias paramétricas particulares han sido reconocidas como estadísticas U para distribuciones generales. En estadística no paramétrica , la teoría de la estadística U se utiliza para establecer procedimientos estadísticos (como estimadores y pruebas) y estimadores relacionados con la normalidad asintótica y con la varianza (en muestras finitas) de tales cantidades. [3] La teoría se ha utilizado para estudiar estadísticas más generales, así como procesos estocásticos , como gráficos aleatorios . [4] [5] [6]
Supongamos que un problema involucra variables aleatorias independientes y distribuidas de manera idéntica y que se requiere la estimación de un determinado parámetro. Supongamos que se puede construir una estimación insesgada simple basada en sólo unas pocas observaciones: esto define el estimador básico basado en un número determinado de observaciones. Por ejemplo, una sola observación es en sí misma una estimación insesgada de la media y se pueden utilizar un par de observaciones para derivar una estimación insesgada de la varianza. El estadístico U basado en este estimador se define como el promedio (de todas las selecciones combinatorias del tamaño dado del conjunto completo de observaciones) del estimador básico aplicado a las submuestras.
Pranab K. Sen (1992) proporciona una revisión del artículo de Wassily Hoeffding (1948), que introdujo las estadísticas U y expuso la teoría relacionada con ellas, y al hacerlo, Sen describe la importancia que tienen las estadísticas U en la teoría estadística. Sen dice: [7] “El impacto de Hoeffding (1948) es abrumador en la actualidad y es muy probable que continúe en los años venideros”. Tenga en cuenta que la teoría de la estadística U no se limita a [8] el caso de variables aleatorias independientes e idénticamente distribuidas o a variables aleatorias escalares. [9]
Definición
El término estadístico U, debido a Hoeffding (1948), se define de la siguiente manera.
Sean números reales o complejos, y sea una función valorada de variables dimensionales. Para cada uno, el estadístico U asociado se define como el promedio de los valores sobre el conjunto de tuplas de índices con entradas distintas. Formalmente,![{\displaystyle K}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f\doson (K^{d})^{r}\to K}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle K}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle d}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n\geq r}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f_{n}\dos puntos (K^{d})^{n}\to K}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle f (x_ {i_ {1}}, \ dotsc, x_ {i_ {r}})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle I_ {r, n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle r}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \{1,2,\dotsc ,n\}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
.
En particular, si es simétrico lo anterior se simplifica a![{\displaystyle f}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
,
donde ahora denota el subconjunto de tuplas crecientes .![{\displaystyle J_{r,n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle I_ {r, n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Cada estadístico U es necesariamente una función simétrica .![{\ Displaystyle f_ {n}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Las estadísticas U son muy naturales en el trabajo estadístico, particularmente en el contexto de Hoeffding de variables aleatorias independientes e idénticamente distribuidas , o más generalmente para secuencias intercambiables , como en el muestreo aleatorio simple de una población finita, donde la propiedad definitoria se denomina "herencia en la promedio'.
El estadístico k de Fisher y los polikays de Tukey son ejemplos de estadístico U polinomial homogéneo (Fisher, 1929; Tukey, 1950).
Para una muestra aleatoria simple φ de tamaño n tomada de una población de tamaño N , el estadístico U tiene la propiedad de que el promedio de los valores muestrales ƒ n ( xφ ) es exactamente igual al valor poblacional ƒ N ( x ). [ se necesita aclaración ]
Ejemplos
Algunos ejemplos: Si el estadístico U es la media muestral.![{\displaystyle f(x)=x}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f_{n}(x)={\bar {x}}_{n}=(x_{1}+\cdots +x_{n})/n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Si , el estadístico U es la desviación media por pares , definida para .![{\displaystyle f(x_{1},x_{2})=|x_{1}-x_{2}|}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f_{n}(x_{1},\ldots ,x_{n})=2/(n(n-1))\sum _{i>j}|x_{i}-x_{j} |}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n\geq 2}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Si , el estadístico U es la varianza muestral
con divisor , definida para .
![{\displaystyle f_{n}(x)=\sum (x_{i}-{\bar {x}}_{n})^{2}/(n-1)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n-1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n\geq 2}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
El tercer estadístico , la asimetría muestral definida para , es un estadístico U.![{\displaystyle k}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle k_{3,n}(x)=\sum (x_{i}-{\bar {x}}_{n})^{3}n/((n-1)(n-2) )}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n\geq 3}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
El siguiente caso resalta un punto importante. Si es la mediana de tres valores, no es la mediana de valores. Sin embargo, es una estimación insesgada de varianza mínima del valor esperado de la mediana de tres valores, no la mediana de la población. Estimaciones similares desempeñan un papel central cuando los parámetros de una familia de distribuciones de probabilidad se estiman mediante momentos ponderados de probabilidad o momentos L.![{\ Displaystyle f (x_ {1}, x_ {2}, x_ {3})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle f_{n}(x_{1},\ldots,x_{n})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Ver también
Notas
- ^ Cox y Hinkley (1974), pág. 200, pág. 258
- ^ Hoeffding (1948), entre las ecuaciones (4.3), (4.4)
- ^ Sen (1992)
- ^ Página 508 en Koroljuk, VS; Borovskich, Yu. V. (1994). Teoría de la estadística U. Matemáticas y sus Aplicaciones. vol. 273 (Traducido por PV Malyshev y DV Malyshev de la edición original rusa de 1989). Dordrecht: Grupo de editores académicos de Kluwer. págs.x+552. ISBN 0-7923-2608-3. SEÑOR 1472486.
- ^ Páginas 381–382 en Borovskikh, Yu. V. (1996).Estadísticos U en espacios de Banach . Utrecht: VSP. págs. xii+420. ISBN 90-6764-200-2. SEÑOR 1419498.
- ^ Página xii en Kwapień, Stanisƚaw; Woyczyński, Wojbor A. (1992). Series aleatorias e integrales estocásticas: simples y múltiples . Probabilidad y sus aplicaciones. Boston, MA: Birkhäuser Boston, Inc. págs. xvi+360. ISBN 0-8176-3572-6. SEÑOR 1167198.
- ^ Sen (1992) pág. 307
- ^ Sen (1992), p306
- ^ El último capítulo de Borovskikh analiza las estadísticas U para elementos aleatorios intercambiables que toman valores en un espacio vectorial ( espacio de Banach separable ).
Referencias
- Borovskikh, Yu. V. (1996).Estadísticos U en espacios de Banach . Utrecht: VSP. págs. xii+420. ISBN 90-6764-200-2. SEÑOR 1419498.
- Cox, DR, Hinkley, DV (1974) Estadística teórica . Chapman y Hall. ISBN 0-412-12420-3
- Fisher, RA (1929) Momentos y momentos producto de distribuciones muestrales. Actas de la Sociedad Matemática de Londres , 2, 30:199–238.
- Hoeffding, W. (1948) Una clase de estadística con distribuciones asintóticamente normales. Anales de estadística , 19:293–325. (Reimpreso parcialmente en: Kotz, S., Johnson, NL (1992) Breakthroughs in Statistics , Vol I, págs. 308–334. Springer-Verlag. ISBN 0-387-94037-5 )
- Koroljuk, VS; Borovskich, Yu. V. (1994). Teoría de la estadística U. Matemáticas y sus Aplicaciones. vol. 273 (Traducido por PV Malyshev y DV Malyshev de la edición original rusa de 1989). Dordrecht: Grupo de editores académicos de Kluwer. págs.x+552. ISBN 0-7923-2608-3. SEÑOR 1472486.
- Lee, AJ (1990) Estadística U: teoría y práctica . Marcel Dekker, Nueva York. pp320 ISBN 0-8247-8253-4
- Sen, PK (1992) Introducción a Hoeffding (1948) Una clase de estadística con distribución asintóticamente normal. En: Kotz, S., Johnson, NL Breakthroughs in Statistics , Vol I, págs. 299–307. Springer-Verlag. ISBN 0-387-94037-5 .
- Serfling, Robert J. (1980). Teoremas de aproximación de la estadística matemática . Nueva York: John Wiley and Sons. ISBN 0-471-02403-1.
- Tukey, JW (1950). "Algunos muestreos simplificados". Revista de la Asociación Estadounidense de Estadística . 45 (252): 501–519. doi :10.1080/01621459.1950.10501142.
- Halmos, P. (1946). "La teoría de la estimación imparcial". Anales de estadística matemática . 1 (17): 34–43. doi : 10.1214/aoms/1177731020 .