Desigualdad aplicada a espacios de probabilidad.
En teoría de la probabilidad , la desigualdad de Boole , también conocida como límite de unión , dice que para cualquier conjunto finito o contable de eventos , la probabilidad de que ocurra al menos uno de los eventos no es mayor que la suma de las probabilidades de los eventos individuales. Esta desigualdad proporciona un límite superior a la probabilidad de que ocurra al menos uno de un número contable de eventos en términos de las probabilidades individuales de los eventos. La desigualdad de Boole lleva el nombre de su descubridor, George Boole . [1]
Formalmente, para un conjunto contable de eventos A 1 , A 2 , A 3 , ..., tenemos
![{\displaystyle {\mathbb {P} }\left(\bigcup _{i=1}^{\infty }A_{i}\right)\leq \sum _{i=1}^{\infty }{\ mathbb {P} }(A_ {i}).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
En términos de teoría de las medidas , la desigualdad de Boole se deriva del hecho de que una medida (y ciertamente cualquier medida de probabilidad ) es σ - subaditiva .
Prueba
Prueba mediante inducción
La desigualdad de Boole puede demostrarse para conjuntos finitos de eventos utilizando el método de inducción.![{\displaystyle n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Para el caso, se deduce que![{\displaystyle n=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbb {P} (A_{1})\leq \mathbb {P} (A_{1}).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Para el caso tenemos![{\displaystyle n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle {\mathbb {P} }\left(\bigcup _{i=1}^{n}A_{i}\right)\leq \sum _{i=1}^{n}{\mathbb { P} }(A_{i}).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Dado que y debido a que la operación sindical es asociativa , tenemos![{\displaystyle \mathbb {P} (A\cup B)=\mathbb {P} (A)+\mathbb {P} (B)-\mathbb {P} (A\cap B),}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n+1}A_{i}\right)=\mathbb {P} \left(\bigcup _{i=1}^ {n}A_{i}\right)+\mathbb {P} (A_{n+1})-\mathbb {P} \left(\bigcup _{i=1}^{n}A_{i}\ tapa A_ {n+1}\derecha).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Desde
![{\displaystyle {\mathbb {P} }\left(\bigcup _{i=1}^{n}A_{i}\cap A_{n+1}\right)\geq 0,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
por el primer axioma de probabilidad , tenemos
![{\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n+1}A_{i}\right)\leq \mathbb {P} \left(\bigcup _{i=1} ^{n}A_{i}\right)+\mathbb {P} (A_{n+1}),}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
y por lo tanto
![{\displaystyle \mathbb {P} \left(\bigcup _{i=1}^{n+1}A_{i}\right)\leq \sum _{i=1}^{n}\mathbb {P } (A_{i})+\mathbb {P} (A_{n+1})=\sum _{i=1}^{n+1}\mathbb {P} (A_{i}).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Prueba sin utilizar inducción.
Para cualquier evento en nuestro espacio de probabilidad tenemos![{\ Displaystyle A_ {1}, A_ {2}, A_ {3}, \ puntos}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbb {P} \left(\bigcup _{i}A_{i}\right)\leq \sum _{i}\mathbb {P} (A_{i}).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Uno de los axiomas de un espacio de probabilidad es que si hay subconjuntos disjuntos del espacio de probabilidad, entonces![{\ Displaystyle B_ {1}, B_ {2}, B_ {3}, \ puntos}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbb {P} \left(\bigcup _{i}B_{i}\right)=\sum _{i}\mathbb {P} (B_{i});}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
esto se llama aditividad contable.
Si modificamos los conjuntos , se vuelven disjuntos,![{\ Displaystyle A_ {i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle B_{i}=A_{i}-\bigcup _{j=1}^{i-1}A_{j}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
podemos demostrar que
![{\displaystyle \bigcup _{i=1}^{\infty }B_{i}=\bigcup _{i=1}^{\infty }A_{i}.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
demostrando ambas direcciones de inclusión.
Suponer . Luego por un mínimo tal que . Por lo tanto . Entonces la primera inclusión es verdadera: .![{\displaystyle x\in \bigcup _{i=1}^{\infty }A_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle x \ en A_ {k}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle k}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle i<k\implica x\notin A_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle x\in B_{k}=A_{k}-\bigcup _{j=1}^{k-1}A_{j}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \bigcup _{i=1}^{\infty }A_{i}\subset \bigcup _{i=1}^{\infty }B_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
A continuación supongamos que . De ello se deduce que para algunos . Y así , y tenemos la otra inclusión :.![{\displaystyle x\in \bigcup _{i=1}^{\infty }B_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle x \ en B_ {k}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle k}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle B_{k}=A_{k}-\bigcup _{j=1}^{k-1}A_{j}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle x \ en A_ {k}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \bigcup _{i=1}^{\infty }B_{i}\subset \bigcup _{i=1}^{\infty }A_{i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Por construcción de cada , . Porque es el caso que![{\ Displaystyle B_ {i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle B_ {i} \ subconjunto A_ {i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle B\subconjunto A,}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbb {P} (B)\leq \mathbb {P} (A).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Entonces, podemos concluir que la desigualdad deseada es cierta:
![{\displaystyle \mathbb {P} \left(\bigcup _{i}A_{i}\right)=\mathbb {P} \left(\bigcup _{i}B_{i}\right)=\sum _ {i}\mathbb {P} (B_{i})\leq \sum _{i}\mathbb {P} (A_{i}).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Desigualdades de Bonferroni
La desigualdad de Boole se puede generalizar para encontrar límites superior e inferior de la probabilidad de uniones finitas de eventos. [2] Estos límites se conocen como desigualdades de Bonferroni , en honor a Carlo Emilio Bonferroni ; véase Bonferroni (1936).
Dejar
![{\displaystyle S_{1}:=\sum _{i=1}^{n}{\mathbb {P} }(A_{i}),\quad S_{2}:=\sum _{1\leq i_{1}<i_{2}\leq n}{\mathbb {P} }(A_{i_{1}}\cap A_{i_{2}}),\quad \ldots ,\quad S_{k} :=\sum _{1\leq i_{1}<\cdots <i_{k}\leq n}{\mathbb {P} }(A_{i_{1}}\cap \cdots \cap A_{i_{ k}})}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
para todos los números enteros k en {1, ..., n }.
Entonces, cuando es impar:![{\displaystyle K\leq n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \sum _{j=1}^{K}(-1)^{j-1}S_{j}\geq \mathbb {P} \left(\bigcup _{i=1}^{n }A_ {i}\right)=\sum _ {j=1}^{n}(-1)^{j-1}S_ {j}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
se mantiene y cuando es par:![{\displaystyle K\leq n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \sum _{j=1}^{K}(-1)^{j-1}S_{j}\leq \mathbb {P} \left(\bigcup _{i=1}^{n }A_ {i}\right)=\sum _ {j=1}^{n}(-1)^{j-1}S_ {j}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
sostiene.
Las igualdades se derivan del principio de inclusión-exclusión , y la desigualdad de Boole es el caso especial de .![{\displaystyle K=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Prueba de K impar
Vamos , dónde para cada uno . Estos dividen el espacio muestral y, para todos y cada uno , están contenidos en él o separados de él.![{\displaystyle E=\bigcap _ {i=1}^{n}B_ {i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle B_{i}\in \{A_{i},A_{i}^{c}\}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle i=1,\puntos,n}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle i}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle A_ {i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Si , entonces aporta 0 a ambos lados de la desigualdad. ![{\displaystyle E=\bigcap _{i=1}^{n}A_{i}^{c}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
De lo contrario, suponga que está contenido exactamente en el archivo . Luego contribuye exactamente al lado derecho de la desigualdad, mientras que contribuye ![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle L}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle A_ {i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \mathbb {P} (E)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \sum _{j=1}^{K}(-1)^{j-1}{L \choose j}\mathbb {P} (E)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
al lado izquierdo de la desigualdad. Sin embargo, según la regla de Pascal , esto es igual a
![{\displaystyle \sum _{j=1}^{K}(-1)^{j-1}\left({L-1 \elegir j-1}+{L-1 \elegir j}\right) \mathbb{P} (E)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
qué telescopios usar
![{\displaystyle \left(1+{L-1 \choose K}\right)\mathbb {P} (E)\geq \mathbb {P} (E)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Por lo tanto, la desigualdad se cumple para todos los eventos y, por lo tanto, sumando obtenemos la desigualdad deseada:![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \sum _{j=1}^{K}(-1)^{j-1}S_{j}\geq \mathbb {P} \left(\bigcup _{i=1}^{n }A_ {i}\derecha)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La prueba de par es casi idéntica. [3]![{\displaystyle K}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Ejemplo
Suponga que está estimando 5 parámetros basándose en una muestra aleatoria y puede controlar cada parámetro por separado. Si desea que sus estimaciones de los cinco parámetros sean buenas con una probabilidad del 95%, ¿qué debe hacer con cada parámetro?
Ajustar la probabilidad de que cada parámetro sea bueno dentro del 95% no es suficiente porque "todos son buenos" es un subconjunto de cada evento "Estimación i es buena". Podemos utilizar la desigualdad de Boole para resolver este problema. Al encontrar el complemento del evento "los cinco son buenos", podemos cambiar esta pregunta a otra condición:
P(al menos una estimación es mala) = 0,05 ≤ P(A 1 es mala) + P(A 2 es mala) + P(A 3 es mala) + P(A 4 es mala) + P(A 5 es mala )
Una forma es hacer que cada uno de ellos sea igual a 0,05/5 = 0,01, es decir, 1%. En otras palabras, debe garantizar que cada estimación sea buena al 99 % (por ejemplo, construyendo un intervalo de confianza del 99 %) para asegurarse de que la estimación total sea buena con una probabilidad del 95 %. Esto se llama método Bonferroni de inferencia simultánea.
Ver también
Referencias
- ^ Boole, George (1847). El análisis matemático de la lógica. Biblioteca Filosófica. ISBN 9780802201546.
- ^ Casella, George; Berger, Roger L. (2002). Inferencia estadística. Duxbury. págs. 11-13. ISBN 0-534-24312-6.
- ^ Venkatesh, Santosh (2012). La teoría de la probabilidad. Prensa de la Universidad de Cambridge. págs. 94–99, 113–115. ISBN 978-0-534-24312-8.
Otros artículos relacionados
- Bonferroni, Carlo E. (1936), "Teoria statistica delle classi e calcolo delle probabilità", Pubbl. DR Ist. Súper. Di ciencia. Economía. E Commerciali di Firenze (en italiano), 8 : 1–62, Zbl 0016.41103
- Dohmen, Klaus (2003), Desigualdades de Bonferroni mejoradas mediante tubos abstractos. Desigualdades e identidades de inclusión-tipo de exclusión , Lecture Notes in Mathematics, vol. 1826, Berlín: Springer-Verlag , págs. viii+113, ISBN 3-540-20025-8, SEÑOR 2019293, Zbl 1026.05009
- Galambos, János ; Simonelli, Italo (1996), Desigualdades de tipo Bonferroni con aplicaciones , probabilidad y sus aplicaciones, Nueva York: Springer-Verlag , págs. x+269, ISBN 0-387-94776-0, SEÑOR 1402242, Zbl 0869.60014
- Galambos, János (1977), "Desigualdades de Bonferroni", Annals of Probability , 5 (4): 577–581, doi : 10.1214/aop/1176995765 , JSTOR 2243081, MR 0448478, Zbl 0369.60018
- Galambos, János (2001) [1994], "Desigualdades de Bonferroni", Enciclopedia de Matemáticas , EMS Press
Este artículo incorpora material de las desigualdades de Bonferroni en PlanetMath , que tiene la licencia Creative Commons Attribution/Share-Alike License .