stringtranslate.com

La desigualdad de Azuma

En teoría de la probabilidad , la desigualdad de Azuma-Hoeffding (llamada así en honor a Kazuoki Azuma y Wassily Hoeffding ) da un resultado de concentración para los valores de martingalas que tienen diferencias acotadas.

Supongamos que es una martingala (o supermartingala ) y

casi seguramente . Entonces, para todos los números enteros positivos N y todos los reales positivos ,

Y simétricamente (cuando X k es una submartingala):

Si X es una martingala, usar las dos desigualdades anteriores y aplicar el límite de unión permite obtener un límite de dos lados:

Prueba

La prueba comparte una idea similar a la prueba de la forma general de la desigualdad de Azuma que se enumera a continuación. En realidad, esto puede verse como un corolario directo de la forma general de desigualdad de Azuma.

Una forma general de la desigualdad de Azuma.

Limitación de la desigualdad de vainilla de Azuma.

Tenga en cuenta que la desigualdad básica de Azuma requiere límites simétricos en incrementos de martingala, es decir . Entonces, si el límite conocido es asimétrico, por ejemplo , para usar la desigualdad de Azuma, es necesario elegir cuál podría ser un desperdicio de información sobre el límite de . Sin embargo, este problema se puede resolver y se puede obtener una probabilidad más estricta ligada a la siguiente forma general de la desigualdad de Azuma.

Declaración

Sea una martingala (o supermartingala) con respecto a la filtración . Supongamos que hay procesos predecibles y con respecto a , es decir, para todos , son mensurables y constantes tales que

casi con seguridad. Entonces para todos ,

Dado que una submartingala es una supermartingala con signos invertidos, tenemos if en cambio es una martingala (o submartingala),

Si es una martingala, dado que es a la vez una supermartingala y una submartingala, aplicando la unión ligada a las dos desigualdades anteriores, podríamos obtener la ligada de dos lados:

Prueba

Demostraremos el caso de la supermartingala sólo porque el resto es evidente. Mediante la descomposición de Doob , podríamos descomponer la supermartingala como donde es una martingala y es una secuencia predecible no creciente (tenga en cuenta que si en sí misma es una martingala, entonces ). De , tenemos

Aplicando Chernoff ligado a , tenemos para ,

Para el término de expectativa interna, ya que

(i) como lo es una martingala;

(ii) ;

(iii) y son ambos mensurables ya que son un proceso predecible;

(iv) ;

Aplicando el lema de Hoeffding [nota 1] , tenemos

Repitiendo este paso se podría obtener

Tenga en cuenta que el mínimo se logra en , por lo que tenemos

Finalmente, dado que y como no es creciente, evento implica y por lo tanto

Observación

Tenga en cuenta que al establecer , podríamos obtener la desigualdad básica de Azuma.

Tenga en cuenta que tanto para la submartingala como para la supermartingala, solo se cumple un lado de la desigualdad de Azuma. No podemos decir mucho sobre qué tan rápido sube una submartingala con incrementos acotados (o cae una supermartingala).

Esta forma general de la desigualdad de Azuma aplicada a la martingala de Doob da la desigualdad de McDiarmid, que es común en el análisis de algoritmos aleatorios .


Ejemplo simple de la desigualdad de Azuma al lanzar una moneda

Sea F i una secuencia de lanzamientos de moneda aleatorios independientes e idénticamente distribuidos (es decir, sea igualmente probable que F i sea −1 o 1 independiente de los otros valores de F i ). La definición produce una martingala con | X k  −  X k −1 | ≤ 1, lo que nos permite aplicar la desigualdad de Azuma. Específicamente, obtenemos

Por ejemplo, si establecemos t proporcional a n , entonces esto nos dice que aunque el valor máximo posible de X n aumenta linealmente con n , la probabilidad de que la suma aumente linealmente con n disminuye exponencialmente rápido con  n .

Si configuramos obtenemos:

lo que significa que la probabilidad de desviarse más de se acerca a 0 cuando n tiende a infinito.

Observación

Sergei Bernstein demostró una desigualdad similar bajo supuestos más débiles en 1937.

Hoeffding demostró este resultado para variables independientes en lugar de diferencias de martingala, y también observó que ligeras modificaciones de su argumento establecen el resultado para diferencias de martingala (consulte la página 9 de su artículo de 1963).

Ver también

Notas

  1. ^ Sin embargo, no es una aplicación directa del lema de Hoeffding. El enunciado del lema de Hoeffding maneja la expectativa total, pero también es válido para el caso en que la expectativa es una expectativa condicional y los límites son mensurables con respecto al campo sigma al que está condicionada la expectativa condicional. La prueba es la misma que para el lema de Hoeffding clásico.

Referencias