En teoría de la probabilidad , una medida empírica es una medida aleatoria que surge de una realización particular de una secuencia (normalmente finita) de variables aleatorias . La definición precisa se encuentra a continuación. Las medidas empíricas son relevantes para la estadística matemática .
La motivación para estudiar medidas empíricas es que a menudo es imposible conocer la verdadera medida de probabilidad subyacente . Recopilamos observaciones y calculamos frecuencias relativas . Podemos estimar , o una función de distribución relacionada por medio de la medida empírica o la función de distribución empírica, respectivamente. Estas son estimaciones uniformemente buenas bajo ciertas condiciones. Los teoremas en el área de procesos empíricos proporcionan tasas de esta convergencia.
Definición
Sea una secuencia de variables aleatorias independientes distribuidas de forma idéntica con valores en el espacio de estados S con distribución de probabilidad P.
Definición
- La medida empírica P n se define para subconjuntos mensurables de S y se da por
- donde es la función indicadora y es la medida de Dirac .
Propiedades
- Para un conjunto medible fijo A , nP n ( A ) es una variable aleatoria binomial con media nP ( A ) y varianza nP ( A )(1 − P ( A )).
- Para una partición fija de S , las variables aleatorias forman una distribución multinomial con probabilidades de eventos
- La matriz de covarianza de esta distribución multinomial es .
Definición
- es la medida empírica indexada por , una colección de subconjuntos mensurables de S .
Para generalizar aún más esta noción, observe que la medida empírica asigna funciones mensurables a su media empírica ,
En particular, la medida empírica de A es simplemente la media empírica de la función indicadora, P n ( A ) = P n I A .
Para una función medible fija , es una variable aleatoria con media y varianza .
Por la ley fuerte de los grandes números , P n ( A ) converge a P ( A ) casi con seguridad para A fijo . De manera similar, converge a casi con seguridad para una función medible fija . El problema de la convergencia uniforme de P n a P estuvo abierto hasta que Vapnik y Chervonenkis lo resolvieron en 1968. [1]
Si la clase (o ) es Glivenko–Cantelli con respecto a P entonces P n converge a P uniformemente sobre (o ). En otras palabras, con probabilidad 1 tenemos
Función de distribución empírica
La función de distribución empírica proporciona un ejemplo de medidas empíricas. Para variables aleatorias iid de valor real, está dada por
En este caso, las medidas empíricas están indexadas por una clase Se ha demostrado que es una clase Glivenko-Cantelli uniforme , en particular,
con probabilidad 1.
Véase también
Referencias
- ^ Vapnik, V.; Chervonenkis, A (1968). "Convergencia uniforme de frecuencias de ocurrencia de eventos a sus probabilidades". Dokl. Akad. Nauk SSSR . 181 .
Lectura adicional
- Billingsley, P. (1995). Probabilidad y medida (tercera edición). Nueva York: John Wiley and Sons. ISBN 0-471-80478-9.
- Donsker, MD (1952). "Justificación y extensión del enfoque heurístico de Doob a los teoremas de Kolmogorov-Smirnov". Anales de estadística matemática . 23 (2): 277–281. doi : 10.1214/aoms/1177729445 .
- Dudley, RM (1978). "Teoremas del límite central para medidas empíricas". Anales de probabilidad . 6 (6): 899–929. doi : 10.1214/aop/1176995384 . JSTOR 2243028.
- Dudley, RM (1999). Teoremas del límite central uniforme . Cambridge Studies in Advanced Mathematics. Vol. 63. Cambridge, Reino Unido: Cambridge University Press. ISBN 0-521-46102-2.
- Wolfowitz, J. (1954). "Generalización del teorema de Glivenko-Cantelli". Anales de estadística matemática . 25 (1): 131–138. doi : 10.1214/aoms/1177728852 . JSTOR 2236518.