stringtranslate.com

Teorema de Glivenko-Cantelli

El diagrama de la izquierda ilustra el teorema de Glivenko-Cantelli para distribuciones uniformes. El diagrama de la derecha ilustra el teorema de Donsker-Skorokhod-Kolmogorov.
El mismo diagrama para distribuciones normales

En la teoría de la probabilidad , el teorema de Glivenko-Cantelli (a veces denominado Teorema Fundamental de Estadística ), llamado así por Valery Ivanovich Glivenko y Francesco Paolo Cantelli , describe el comportamiento asintótico de la función de distribución empírica a medida que crece el número de observaciones independientes e idénticamente distribuidas . [1] Específicamente, la función de distribución empírica converge de manera uniforme a la función de distribución verdadera casi con seguridad .

La convergencia uniforme de medidas empíricas más generales se convierte en una propiedad importante de las clases de funciones o conjuntos de Glivenko-Cantelli . [2] Las clases de Glivenko-Cantelli surgen en la teoría de Vapnik-Chervonenkis , con aplicaciones en el aprendizaje automático . Se pueden encontrar aplicaciones en econometría haciendo uso de estimadores M.

Declaración

Supongamos que son variables aleatorias independientes e idénticamente distribuidas en con una función de distribución acumulativa común . La función de distribución empírica para se define por

donde es la función indicadora del conjunto Para cada (fijo) es una secuencia de variables aleatorias que convergen a casi con seguridad por la ley fuerte de los grandes números . Glivenko y Cantelli reforzaron este resultado al demostrar la convergencia uniforme de a

Teorema

casi con toda seguridad. [3] (p 265)

Este teorema se origina con Valery Glivenko [4] y Francesco Cantelli [ 5] en 1933.

Observaciones

Prueba

Para simplificar, considere un caso de variable aleatoria continua . Fije de modo que para . Ahora, para todos existe tal que .

Por lo tanto,

Dado que, por la ley fuerte de los grandes números, podemos garantizar que para cualquier número entero positivo y cualquier número entero tal que , podemos encontrar tal que para todo , tenemos . Combinado con el resultado anterior, esto implica además que , que es la definición de convergencia casi segura.

Medidas empíricas

Se puede generalizar la función de distribución empírica reemplazando el conjunto por un conjunto arbitrario C de una clase de conjuntos para obtener una medida empírica indexada por conjuntos.

¿Dónde está la función indicadora de cada conjunto ?

Una generalización adicional es el mapa inducido por sobre funciones reales mensurables f , que se da por

Entonces se convierte en una propiedad importante de estas clases si la ley fuerte de los grandes números se cumple uniformemente en o .

Clase Glivenko-Cantelli

Consideremos un conjunto con un álgebra sigma de subconjuntos de Borel A y una medida de probabilidad para una clase de subconjuntos,

y una clase de funciones

definir variables aleatorias

donde es la medida empírica, es el mapa correspondiente, y

suponiendo que exista.

Definiciones

casi seguro como
en probabilidad como
como
como

Las clases de funciones de Glivenko-Cantelli (así como sus formas uniformes y universales) se definen de manera similar, reemplazando todas las instancias de con .

Las versiones débiles y fuertes de las diversas propiedades de Glivenko-Cantelli suelen coincidir en determinadas condiciones de regularidad. La siguiente definición suele aparecer en tales condiciones de regularidad:


Teoremas

Los dos teoremas siguientes proporcionan condiciones suficientes para que las versiones débil y fuerte de la propiedad de Glivenko-Cantelli sean equivalentes.

Teorema ( Talagrand , 1987) [6]

Sea una clase de funciones integrables y defina . Entonces las siguientes son equivalentes:


Teorema ( Dudley , Giné y Zinn, 1991) [7]

Supongamos que una clase de función está acotada. Supongamos también que el conjunto es Suslin admisible en imágenes. Entonces es una clase Glivenko-Cantelli uniforme débil si y solo si es una clase Glivenko-Cantelli uniforme fuerte.

El siguiente teorema es fundamental para el aprendizaje estadístico de las tareas de clasificación binaria.

Teorema ( Vapnik y Chervonenkis , 1968) [8]

Bajo ciertas condiciones de consistencia, una clase universalmente medible de conjuntos es una clase Glivenko-Cantelli uniforme si y sólo si es una clase Vapnik-Chervonenkis .

Existen diversas condiciones de consistencia para la equivalencia de clases uniformes de Glivenko-Cantelli y Vapnik-Chervonenkis. En particular, cualquiera de las siguientes condiciones para una clase es suficiente: [9]

Ejemplos

, es decir, es de clase uniforme Glivenko-Cantelli.

Véase también

Referencias

  1. ^ Howard G. Tucker (1959). "Una generalización del teorema de Glivenko-Cantelli". Anales de estadística matemática . 30 (3): 828–830. doi : 10.1214/aoms/1177706212 . JSTOR  2237422.
  2. ^ van der Vaart, AW (1998). Estadísticas asintóticas . Prensa de la Universidad de Cambridge. pag. 279.ISBN 978-0-521-78450-4.
  3. ^ ab van der Vaart, AW (1998). Estadísticas asintóticas . Prensa de la Universidad de Cambridge. ISBN 978-0-521-78450-4.
  4. ^ Glivenko, V. (1933). "Sulla determinazione empirica delle leggi di probabilità". Giorn. Ist. Italiano. Attuari (en italiano). 4 : 92–99.
  5. ^ Cantelli, FP (1933). "Sulla determinazione empirica delle leggi di probabilità". Giorn. Ist. Italiano. Attuari . 4 : 421–424.
  6. ^ Talagrand, M. (1987). "El problema de Glivenko-Cantelli". Anales de probabilidad . 15 : 837–870. doi :10.1214/AOP/1176992069.
  7. ^ Dudley, Richard M. ; Giné, Eva; Zinn, Joel C. (1991). "Clases de Glivenko-Cantelli uniformes y universales". Journal of Theoretical Probability . 4 : 485–510. doi :10.1007/BF01210321.
  8. ^ Vapnik, VN ; Chervonenkis, A.Ya. (1971). "Sobre la convergencia uniforme de frecuencias relativas de eventos con sus probabilidades". Teoría de la probabilidad y sus aplicaciones . 16 (2): 264–280. doi :10.1137/1116025.
  9. ^ Pestov, Vladimir (2011). "Capacidad de aprendizaje de PAC versus dimensión VC: una nota al pie de un resultado básico del aprendizaje estadístico". Conferencia conjunta internacional de 2011 sobre redes neuronales . págs. 1141–1145. arXiv : 1104.2097 . doi :10.1109/IJCNN.2011.6033352.

Lectura adicional