Foundations of probability theory
Los axiomas de probabilidad estándar son los fundamentos de la teoría de la probabilidad introducida por el matemático ruso Andrey Kolmogorov en 1933. [1] Estos axiomas siguen siendo centrales y tienen contribuciones directas a las matemáticas, las ciencias físicas y los casos de probabilidad del mundo real. [2]
Existen varios otros enfoques (equivalentes) para formalizar la probabilidad. Los bayesianos a menudo motivarán los axiomas de Kolmogorov invocando en su lugar el teorema de Cox o los argumentos del libro holandés . [3] [4]
Axiomas de Kolmogorov
Los supuestos para establecer los axiomas se pueden resumir de la siguiente manera: Sea un espacio de medida siendo la probabilidad de algún evento , y . Entonces hay un espacio de probabilidad , con espacio muestral , espacio de eventos y medida de probabilidad . [1]![{\displaystyle (\Omega,F,P)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P(\Omega)=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle (\Omega,F,P)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \Omega}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
primer axioma
La probabilidad de un evento es un número real no negativo:
![{\displaystyle P(E)\in \mathbb {R} ,P(E)\geq 0\qquad \forall E\in F}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
¿ Dónde está el espacio para eventos? De ello se deduce que siempre es finito, en contraste con la teoría de la medida más general . Las teorías que asignan probabilidad negativa relajan el primer axioma.![{\displaystyle F}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P(E)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Segundo axioma
Este es el supuesto de unidad de medida : que la probabilidad de que ocurra al menos uno de los eventos elementales en todo el espacio muestral es 1.
![{\displaystyle P(\Omega)=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Tercer axioma
Esta es la suposición de σ-aditividad :
- Cualquier secuencia contable de conjuntos disjuntos (sinónimo de eventos mutuamente excluyentes ) satisface
![{\displaystyle E_{1},E_{2},\ldots }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P\left(\bigcup _{i=1}^{\infty }E_{i}\right)=\sum _{i=1}^{\infty }P(E_{i}).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Algunos autores consideran espacios de probabilidad meramente finitamente aditivos , en cuyo caso sólo se necesita un álgebra de conjuntos , en lugar de una σ-álgebra . [5] Las distribuciones de cuasiprobabilidad en general relajan el tercer axioma.
Consecuencias
De los axiomas de Kolmogorov se pueden deducir otras reglas útiles para estudiar probabilidades. Las pruebas [6] [7] [8] de estas reglas son un procedimiento muy revelador que ilustra el poder del tercer axioma y su interacción con los dos axiomas anteriores. A continuación se muestran cuatro de los corolarios inmediatos y sus pruebas:
monotonicidad
![{\displaystyle \quad {\text{if}}\quad A\subseteq B\quad {\text{entonces}}\quad P(A)\leq P(B).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Si A es un subconjunto de B o igual a B, entonces la probabilidad de A es menor o igual a la probabilidad de B.
Prueba de monotonicidad [6]
Para verificar la propiedad de monotonicidad, configuramos y , dónde y para . A partir de las propiedades del conjunto vacío ( ), es fácil ver que los conjuntos son disjuntos por pares y . Por lo tanto, obtenemos del tercer axioma que![{\displaystyle E_{1}=A}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E_{2}=B\setminus A}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle A\subseteq B}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E_{i}=\varnothing }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle i\geq 3}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \varnothing }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\ Displaystyle E_ {i}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle E_{1}\cup E_{2}\cup \cdots =B}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P(A)+P(B\setminus A)+\sum _{i=3}^{\infty }P(E_{i})=P(B).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Dado que, según el primer axioma, el lado izquierdo de esta ecuación es una serie de números no negativos, y dado que converge a cuál es finito, obtenemos tanto como y .![{\displaystyle P(B)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P(A)\leq P(B)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle P(\varnada)=0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La probabilidad del conjunto vacío.
![{\displaystyle P(\varnada)=0.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
En muchos casos, no es el único evento con probabilidad 0.![{\displaystyle \varnothing }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Prueba de la probabilidad del conjunto vacío.
desde ,![{\displaystyle \varnothing \cup \varnothing =\varnothing }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
aplicando el tercer axioma al lado izquierdo (la nota es disjunta consigo misma), y así![{\displaystyle \varnothing }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
restando de cada lado de la ecuación.![{\displaystyle P(\varnada)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La regla del complemento
![{\displaystyle P\left(A^{c}\right)=P(\Omega -A)=1-P(A)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Prueba de la regla del complemento
Dados y son mutuamente excluyentes y que :![{\displaystyle A}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle A^{c}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle A\taza A^{c}=\Omega }](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
... (por el axioma 3)
y, ... (por el axioma 2)![{\displaystyle P(A\cup A^{c})=P(\Omega )=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \Rightarrow P(A)+P(A^{c})=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \por lo tanto P(A^{c})=1-P(A)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
El límite numérico
De la propiedad de monotonía se deduce inmediatamente que
![{\displaystyle 0\leq P(E)\leq 1\qquad \forall E\in F.}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Prueba del límite numérico
Dada la regla del complemento y el axioma 1 :
![{\displaystyle P(E^{c})\geq 0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle 1-P(E)\geq 0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \Rightarrow 1\geq P(E)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle \por lo tanto 0\leq P(E)\leq 1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Otras consecuencias
Otra propiedad importante es:
![{\displaystyle P(A\cup B)=P(A)+P(B)-P(A\cap B).}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Esto se llama ley de probabilidad de la suma o regla de la suma. Es decir, la probabilidad de que ocurra un evento en A o B es la suma de la probabilidad de un evento en A y la probabilidad de un evento en B , menos la probabilidad de un evento que ocurre tanto en A como en B. La prueba de esto es la siguiente:
En primer lugar,
... (por el axioma 3)
Entonces,
(por ).![{\displaystyle B\setminus A=B\setminus (A\cap B)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
También,
![{\displaystyle P(B)=P(B\setminus (A\cap B))+P(A\cap B)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
y eliminando de ambas ecuaciones nos da el resultado deseado.![{\displaystyle P(B\setminus (A\cap B))}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Una extensión de la ley de la suma a cualquier número de conjuntos es el principio de inclusión-exclusión .
Al establecer B en el complemento A c de A en la ley de la suma se obtiene
![{\displaystyle P\left(A^{c}\right)=P(\Omega \setminus A)=1-P(A)}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Es decir, la probabilidad de que cualquier evento no suceda (o el complemento del evento ) es 1 menos la probabilidad de que suceda.
Ejemplo sencillo: lanzamiento de moneda
Considere un solo lanzamiento de moneda y suponga que la moneda saldrá cara (H) o cruz (T) (pero no ambas). No se hace ninguna suposición sobre si la moneda es justa o si algún sesgo depende o no de cómo se lanza la moneda. [9]
Podemos definir:
![{\displaystyle \Omega =\{H,T\}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
![{\displaystyle F=\{\varnada,\{H\},\{T\},\{H,T\}\}}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
Los axiomas de Kolmogorov implican que:
![{\displaystyle P(\varnada)=0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La probabilidad de que no salga ni cara ni cruz es 0.
![{\displaystyle P(\{H,T\}^{c})=0}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La probabilidad de que salga cara o cruz es 1.
![{\displaystyle P(\{H\})+P(\{T\})=1}](data:image/gif;base64,R0lGODlhAQABAIAAAAAAAP///yH5BAEAAAAALAAAAAABAAEAAAIBRAA7)
La suma de la probabilidad de que salga cara y la probabilidad de que salga cruz es 1.
Ver también
- Álgebra de Borel - Clase de conjuntos matemáticosPages displaying short descriptions of redirect targets
- Probabilidad condicional : probabilidad de que ocurra un evento, dado que ya ha ocurrido otro evento.
- Diseño totalmente probabilístico
- Estadísticas intuitivas : fenómeno cognitivo en el que los organismos utilizan datos para hacer generalizaciones y predicciones sobre el mundo.Pages displaying wikidata descriptions as a fallback
- Cuasiprobabilidad : objetos como distribuciones de probabilidad que violan la σ-aditividad; útil en física computacionalPages displaying short descriptions of redirect targets
- Teoría de conjuntos : rama de las matemáticas que estudia los conjuntos.
- σ-álgebra - Estructura algebraica del álgebra de conjuntosPages displaying short descriptions of redirect targets
Referencias
- ^ ab Kolmogorov, Andrey (1950) [1933]. Fundamentos de la teoría de la probabilidad. Nueva York, Estados Unidos: Chelsea Publishing Company.
- ^ Aldous, David. "¿Cuál es el significado de los axiomas de Kolmogorov?". David Aldous . Consultado el 19 de noviembre de 2019 .
- ^ Cox, RT (1946). "Probabilidad, frecuencia y expectativa razonable". Revista Estadounidense de Física . 14 (1): 1–10. Código bibliográfico : 1946AmJPh..14....1C. doi :10.1119/1.1990764.
- ^ Cox, RT (1961). El álgebra de la inferencia probable . Baltimore, MD: Prensa de la Universidad Johns Hopkins.
- ^ Hájek, Alan (28 de agosto de 2019). "Interpretaciones de la probabilidad". Enciclopedia de Filosofía de Stanford . Consultado el 17 de noviembre de 2019 .
- ^ ab Ross, Sheldon M. (2014). Un primer curso de probabilidad (Novena ed.). Río Upper Saddle, Nueva Jersey. págs.27, 28. ISBN 978-0-321-79477-2. OCLC 827003384.
{{cite book}}
: CS1 maint: location missing publisher (link) - ^ Gerard, David (9 de diciembre de 2017). "Pruebas de axiomas" (PDF) . Consultado el 20 de noviembre de 2019 .
- ^ Jackson, Bill (2010). "Probabilidad (apuntes de la conferencia - Semana 3)" (PDF) . Escuela de Matemáticas, Universidad Queen Mary de Londres . Consultado el 20 de noviembre de 2019 .
- ^ Diaconis, Persi; Holmes, Susan; Montgomery, Richard (2007). "Sesgo dinámico en el lanzamiento de moneda" (PDF) . Revista Siam . 49 (211-235). doi :10.1137/S0036144504446436 . Consultado el 5 de enero de 2024 .
Otras lecturas
- DeGroot, Morris H. (1975). Probabilidades y estadísticas. Lectura: Addison-Wesley. págs. 12-16. ISBN 0-201-01503-X.
- McCord, James R.; Moroney, Richard M. (1964). "Probabilidad axiomática" . Introducción a la teoría de la probabilidad . Nueva York: Macmillan. págs. 13-28.
- Definición formal de probabilidad en el sistema de Mizar y lista de teoremas demostrados formalmente al respecto.