En teoría de la probabilidad, la desigualdad de Hoeffding proporciona una cota superior a la probabilidad de que la suma de variables aleatorias se desvíe una cierta cantidad de su valor esperado.
[1] Las desigualdad de Hoeffding es un caso particular de la desigualdad de Azuma-Hoeffding, aunque generaliza la desigualdad de Bernstein, demostrada por Sergei Bernstein en 1923.
Ambas son casos especiales de la desigualdad de McDiarmid.
Las desigualdad de Hoeffding puede aplicarse al importante especial de variables de Bernouilli idénticamente distribuidas, y este es la manera en que la desigualdad se aplica frecuentemente en combinatoria y en informática.
Si se considera una moneda desequilibrada que muestra cara con probabilidad
y cruz con probabilidad
El valor esperado del número de veces que se obtiene cara es
Más aún, la probabilidad de que se obtengan como mucho
caras puede cuantificarse exactamente mediante la siguiente expresión:
lanzamientos llevan como mucho a
{\displaystyle \Pr {\Big (}n{\text{ lanzamientos llevan como mucho a }}k{\text{ caras}}{\Big )}=\sum _{i=0}^{k}{\binom {n}{i}}p^{i}(1-p)^{n-i}\,.}
k = ( p − ϵ ) n
, la desigualdad de Hoeffding acota esta probabilidad mediante un término que disminuye exponencialmente en
( p − ϵ ) n
k = ( p + ϵ ) n
, la desigualdad de Hoeffding acota la probabilidad de que se obtengan al menos
un número de caras mayor que el valor esperado:
( p + ϵ ) n
En esas condiciones la desigualdad de Hoeffding implica que el número de caras que se obtienen se concentra alrededor de la media, con colas que decrecen exponencialmente.
lanzamientos llevan a un número caras entre
( p − ϵ ) n
( p + ϵ ) n
n variables aleatorias independientes.
están acotadas casi con seguridad; es decir, si se asume para
Se define la media muestral de estas variables como:
El segundo teorema en el artículo de Hoeffding prueba las siguientes desigualdades: que son válidas para valores positivos de t. Aquí
representa el valor esperado de
Nótese que las desigualdades también son válidas cuando las
han sido obtenidas usando muestreo sin reemplazo; en este caso las variables aleatorias no son de ninguna manera indendientes.
Para cotas ligeramente mejores en el caso de muestreo sin reemplazo, puede consultarse el artículo de Serfling (1974).