Espacio de probabilidad

En teoría de la probabilidad , un espacio de probabilidad o una triple de probabilidad es una construcción matemática que proporciona un modelo formal de un proceso aleatorio o "experimento". Por ejemplo, se puede definir un espacio de probabilidad que modele el lanzamiento de un dado . $(\Omega ,{\mathcal {F}},P)$

Un espacio de probabilidad consta de tres elementos: ^[1]^[2]

Un espacio muestral , que es el conjunto de todos los resultados posibles . $\Omega$
Un espacio de eventos , que es un conjunto de eventos , siendo un evento un conjunto de resultados en el espacio muestral. ${\mathcal {F}}$
Una función de probabilidad , que asigna, a cada evento en el espacio de eventos, una probabilidad , que es un número entre 0 y 1 (inclusive). $P$

Para proporcionar un modelo de probabilidad, estos elementos deben satisfacer axiomas de probabilidad .

En el ejemplo del lanzamiento de un dado estándar,

El espacio muestral suele ser el conjunto donde cada elemento del conjunto es una etiqueta que representa el resultado del dado que cae en esa etiqueta. Por ejemplo, representa el resultado de que el dado caiga en 1. $\Omega$ $\{1,2,3,4,5,6\}$ $1$
El espacio de eventos podría ser el conjunto de todos los subconjuntos del espacio muestral, que luego contendría eventos simples como ("el dado cae en 5"), así como eventos complejos como ("el dado cae en un número par" ). ${\mathcal {F}}$ $\{5\}$ $\{2,4,6\}$
Luego, la función de probabilidad asignaría cada evento al número de resultados en ese evento dividido por 6; por ejemplo, se asignaría a y se asignaría a . $P$ $\{5\}$ $1/6$ $\{2,4,6\}$ $3/6=1/2$

Cuando se realiza un experimento, se obtiene exactamente un resultado del espacio muestral . Se dice que todos los eventos en el espacio de eventos que contienen el resultado seleccionado "han ocurrido". La función de probabilidad debe definirse de tal manera que si el experimento se repitiera arbitrariamente muchas veces, el número de ocurrencias de cada evento como fracción del número total de experimentos probablemente tenderá hacia la probabilidad asignada a ese evento. $\omega$ $\Omega$ ${\mathcal {F}}$ $\omega$ $P$

El matemático soviético Andrey Kolmogorov introdujo la noción de espacio de probabilidad y los axiomas de probabilidad en la década de 1930. En la teoría de probabilidad moderna, existen enfoques alternativos para la axiomatización, como el álgebra de variables aleatorias .

Introducción

Un espacio de probabilidad es un triplete matemático que presenta un modelo para una clase particular de situaciones del mundo real. Como ocurre con otros modelos, su autor define en última instancia qué elementos contendrán , , y . $(\Omega ,{\mathcal {F}},P)$ $\Omega$ ${\mathcal {F}}$ $P$

El espacio muestral es el conjunto de todos los resultados posibles. Un resultado es el resultado de una única ejecución del modelo. Los resultados pueden ser estados de naturaleza, posibilidades, resultados experimentales y similares. Cada instancia de la situación del mundo real (o ejecución del experimento) debe producir exactamente un resultado. Si los resultados de diferentes ejecuciones de un experimento difieren en algún aspecto importante, son resultados distintos. Las diferencias que importan dependen del tipo de análisis que queramos hacer. Esto conduce a diferentes elecciones de espacio muestral. $\Omega$
El σ-álgebra es una colección de todos los eventos que nos gustaría considerar. Esta colección puede incluir o no cada uno de los eventos elementales . Aquí, un "evento" es un conjunto de cero o más resultados; es decir, un subconjunto del espacio muestral. Se considera que un evento "sucedió" durante un experimento cuando el resultado de este último es un elemento del evento. Dado que el mismo resultado puede ser miembro de muchos eventos, es posible que hayan ocurrido muchos eventos dado un solo resultado. Por ejemplo, cuando la prueba consiste en lanzar dos dados, el conjunto de todos los resultados con una suma de 7 puntos puede constituir un evento, mientras que los resultados con un número impar de puntos pueden constituir otro evento. Si el resultado es el elemento del evento elemental de dos puntos en el primer dado y cinco en el segundo, entonces se dice que ambos eventos, "7 puntos" y "número impar de puntos", han sucedido. ${\mathcal {F}}$
La medida de probabilidad es una función establecida que devuelve la probabilidad de un evento . Una probabilidad es un número real entre cero (los eventos imposibles tienen probabilidad cero, aunque los eventos con probabilidad cero no son necesariamente imposibles) y uno (el evento ocurre casi con seguridad , con casi total certeza). Así es una función La función de medida de probabilidad debe satisfacer dos requisitos simples: Primero, la probabilidad de una unión contable de eventos mutuamente excluyentes debe ser igual a la suma contable de las probabilidades de cada uno de estos eventos. Por ejemplo, la probabilidad de la unión de los eventos mutuamente excluyentes y en el experimento aleatorio de un lanzamiento de moneda, , es la suma de la probabilidad de y la probabilidad de , . En segundo lugar, la probabilidad del espacio muestral debe ser igual a 1 (lo que explica el hecho de que, dada una ejecución del modelo, debe ocurrir algún resultado). En el ejemplo anterior, la probabilidad del conjunto de resultados debe ser igual a uno, porque es completamente seguro que el resultado será o ( el modelo ignora cualquier otra posibilidad) en un solo lanzamiento de moneda. $P$ $P$ $P:{\mathcal {F}}\to [0,1].$ ${\text{Head}}$ ${\text{Tail}}$ $P({\text{Head}}\cup {\text{Tail}})$ ${\text{Head}}$ ${\text{Tail}}$ $P({\text{Head}})+P({\text{Tail}})$ $\Omega$ $P(\{{\text{Head}},{\text{Tail}}\})$ ${\text{Head}}$ ${\text{Tail}}$

No todos los subconjuntos del espacio muestral deben considerarse necesariamente un evento: algunos de los subconjuntos simplemente no son de interés, otros no pueden "medirse" . Esto no es tan obvio en un caso como el del lanzamiento de una moneda. En un ejemplo diferente, se podrían considerar las longitudes de lanzamiento de jabalina, donde los eventos suelen ser intervalos como "entre 60 y 65 metros" y uniones de dichos intervalos, pero no conjuntos como los "números irracionales entre 60 y 65 metros". $\Omega$

Definición

En resumen, un espacio de probabilidad es un espacio de medidas tal que la medida de todo el espacio es igual a uno.

La definición ampliada es la siguiente: un espacio de probabilidad es un triple que consta de: $(\Omega ,{\mathcal {F}},P)$

el espacio muestral : un conjunto arbitrario no vacío , $\Omega$
el σ-álgebra (también llamado σ-campo): un conjunto de subconjuntos de , llamados eventos , tales que: ${\mathcal {F}}\subseteq 2^{\Omega }$ $\Omega$
- ${\mathcal {F}}$ contiene el espacio muestral: , $\Omega \in {\mathcal {F}}$
- ${\mathcal {F}}$ está cerrado bajo complementos : si , entonces también , $A\in {\mathcal {F}}$ $(\Omega \setminus A)\in {\mathcal {F}}$
- ${\mathcal {F}}$ está cerrado bajo uniones contables : si es para , entonces también $A_{i}\in {\mathcal {F}}$ $i=1,2,\dots$ ${\textstyle (\bigcup _{i=1}^{\infty }A_{i})\in {\mathcal {F}}}$
  - El corolario de las dos propiedades anteriores y de la ley de De Morgan es que también está cerrado bajo intersecciones contables : si para , entonces también ${\mathcal {F}}$ $A_{i}\in {\mathcal {F}}$ $i=1,2,\dots$ ${\textstyle (\bigcap _{i=1}^{\infty }A_{i})\in {\mathcal {F}}}$
la medida de probabilidad – una función tal que: $P:{\mathcal {F}}\to [0,1]$ ${\mathcal {F}}$
- P es contablemente aditivo (también llamado σ-aditivo): si es una colección contable de conjuntos disjuntos por pares , entonces $\{A_{i}\}_{i=1}^{\infty }\subseteq {\mathcal {F}}$ ${\textstyle P(\bigcup _{i=1}^{\infty }A_{i})=\sum _{i=1}^{\infty }P(A_{i}),}$
- la medida de todo el espacio muestral es igual a uno: . $P(\Omega )=1$

Caso discreto

La teoría de la probabilidad discreta sólo necesita, como máximo, espacios muestrales contables . Las probabilidades se pueden atribuir a puntos de mediante la función de masa de probabilidad tal que . Todos los subconjuntos de pueden tratarse como eventos (por lo tanto, es el conjunto potencia ). La medida de probabilidad toma la forma simple $\Omega$ $\Omega$ $p:\Omega \to [0,1]$ ${\textstyle \sum _{\omega \in \Omega }p(\omega )=1}$ $\Omega$ ${\mathcal {F}}=2^{\Omega }$

La mayor σ-álgebra describe la información completa. En general, una σ-álgebra corresponde a una partición finita o contable, siendo la forma general de un evento . Vea también los ejemplos. ${\mathcal {F}}=2^{\Omega }$ ${\mathcal {F}}\subseteq 2^{\Omega }$ $\Omega =B_{1}\cup B_{2}\cup \dots$ $A\in {\mathcal {F}}$ $A=B_{k_{1}}\cup B_{k_{2}}\cup \dots$

El caso está permitido por la definición, pero rara vez se utiliza, ya que puede excluirse con seguridad del espacio muestral. $p(\omega )=0$ $\omega$

Caso general

Si $Ω$ es incontable , aun así puede suceder que $P (ω) \neq 0$ para algún $ω$ ; tales $ω$ se llaman átomos . Son como máximo un conjunto contable (tal vez vacío ), cuya probabilidad es la suma de las probabilidades de todos los átomos. Si esta suma es igual a 1, entonces todos los demás puntos pueden excluirse con seguridad del espacio muestral, devolviéndonos al caso discreto. De lo contrario, si la suma de probabilidades de todos los átomos está entre 0 y 1, entonces el espacio de probabilidad se descompone en una parte discreta (atómica) (tal vez vacía) y una parte no atómica .

Caso no atómico

Si $P (ω) = 0$ para todo $ω \in Ω$ (en este caso, Ω debe ser incontable, porque de lo contrario $P(Ω) = 1$ no podría satisfacerse), entonces la ecuación ( ⁎ ) falla: la probabilidad de un conjunto no es necesariamente la suma de las probabilidades de sus elementos, ya que la suma solo se define para números contables de elementos. Esto hace que la teoría del espacio de probabilidad sea mucho más técnica. Es aplicable una formulación más fuerte que la sumatoria, la teoría de la medida . Inicialmente, las probabilidades se atribuyen a algunos conjuntos "generadores" (véanse los ejemplos). Entonces un procedimiento limitante permite asignar probabilidades a conjuntos que son límites de secuencias de conjuntos generadores, o límites de límites, etc. Todos estos conjuntos son el σ-álgebra . Para detalles técnicos consulte el teorema de extensión de Carathéodory . Los conjuntos que pertenecen a se llaman mensurables . En general son mucho más complicados que los grupos electrógenos, pero mucho mejores que los no mensurables . ${\mathcal {F}}$ ${\mathcal {F}}$

Espacio de probabilidad completo

Se dice que un espacio de probabilidad es un espacio de probabilidad completo si para todos con y todos uno tiene . A menudo, el estudio de los espacios de probabilidad se restringe a espacios de probabilidad completos. $(\Omega ,\;{\mathcal {F}},\;P)$ $B\in {\mathcal {F}}$ $P(B)=0$ $A\;\subset \;B$ $A\in {\mathcal {F}}$

Ejemplos

Ejemplos discretos

Ejemplo 1

Si el experimento consiste en simplemente lanzar una moneda al aire , entonces el resultado es cara o cruz: . El σ-álgebra contiene eventos, a saber: ("cara"), ("cruz"), ("ni cara ni cruz") y ("ni cara ni cruz"); en otras palabras, . Hay un cincuenta por ciento de posibilidades de que salga cara y un cincuenta por ciento de que salga cruz, por lo que la medida de probabilidad en este ejemplo es , , , . $\Omega =\{{\text{H}},{\text{T}}\}$ ${\mathcal {F}}=2^{\Omega }$ $2^{2}=4$ $\{{\text{H}}\}$ $\{{\text{T}}\}$ $\{\}$ $\{{\text{H}},{\text{T}}\}$ ${\mathcal {F}}=\{\{\},\{{\text{H}}\},\{{\text{T}}\},\{{\text{H}},{\text{T}}\}\}$ $P(\{\})=0$ $P(\{{\text{H}}\})=0.5$ $P(\{{\text{T}}\})=0.5$ $P(\{{\text{H}},{\text{T}}\})=1$

Ejemplo 2

La moneda justa se lanza tres veces. Hay 8 resultados posibles: $Ω = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT}$ (aquí "HTH", por ejemplo, significa que la primera vez que la moneda salió cara, la segunda vez cruz y la última vez cabezas de nuevo). La información completa se describe mediante el σ-álgebra de $2$ $8$ $= 256$ eventos, donde cada uno de los eventos es un subconjunto de Ω. ${\mathcal {F}}=2^{\Omega }$

Alice sólo conoce el resultado del segundo lanzamiento. Así, su información incompleta se describe mediante la partición $Ω = A 1 ⊔ A 2 = {HHH, HHT, THH, THT} ⊔ {HTH, HTT, TTH, TTT}$ , donde ⊔ es la unión disjunta y la σ-álgebra correspondiente . Bryan sólo sabe el número total de colas. Su partición contiene cuatro partes: $Ω =$ $B$ $0$ $⊔$ $B$ $1$ $⊔$ $B$ $2$ $⊔$ $B$ $3$ $= {HHH} ⊔ {HHT, HTH, THH} ⊔ {TTH, THT, HTT} ⊔ {TTT}$ ; en consecuencia, su σ-álgebra contiene 2 ⁴ = 16 eventos. ${\mathcal {F}}_{\text{Alice}}=\{\{\},A_{1},A_{2},\Omega \}$ ${\mathcal {F}}_{\text{Bryan}}$

Las dos σ-álgebras son incomparables : ni ni ; ambas son sub-σ-álgebras de 2 ^Ω . ${\mathcal {F}}_{\text{Alice}}\subseteq {\mathcal {F}}_{\text{Bryan}}$ ${\mathcal {F}}_{\text{Bryan}}\subseteq {\mathcal {F}}_{\text{Alice}}$

Ejemplo 3

Si se seleccionan al azar 100 votantes de entre todos los votantes de California y se les pregunta por quién votarán para gobernador, entonces el conjunto de todas las secuencias de 100 votantes californianos sería el espacio muestral Ω. Suponemos que se utiliza muestreo sin reemplazo : sólo se permiten secuencias de 100 votantes diferentes . Por simplicidad se considera una muestra ordenada, es decir una secuencia (Alice, Bryan) es diferente de (Bryan, Alice). También damos por sentado que cada votante potencial conoce exactamente su elección futura, es decir, no elige al azar.

Alice sólo sabe si Arnold Schwarzenegger ha recibido al menos 60 votos. Su información incompleta se describe mediante el σ-álgebra que contiene: (1) el conjunto de todas las secuencias en Ω donde al menos 60 personas votan por Schwarzenegger; (2) el conjunto de todas las secuencias donde menos de 60 votan por Schwarzenegger; (3) todo el espacio muestral Ω; y (4) el conjunto vacío ∅. ${\mathcal {F}}_{\text{Alice}}$

Bryan sabe el número exacto de votantes que votarán por Schwarzenegger. Su información incompleta se describe mediante la partición correspondiente $Ω = B 0 ⊔ B 1 ⊔ \dots ⊔ B 100$ y el σ-álgebra consta de 2 ¹⁰¹ eventos. ${\mathcal {F}}_{\text{Bryan}}$

En este caso, el σ-álgebra de Alice es un subconjunto del de Bryan: . El σ-álgebra de Bryan es, a su vez, un subconjunto de la σ-álgebra 2 ^Ω de "información completa", mucho más grande, que consta de $2$ $n$ $($ $n$ $-1)\dots($ $n$ $-99)$ eventos, donde n es el número de todos los votantes potenciales en California. . ${\mathcal {F}}_{\text{Alice}}\subset {\mathcal {F}}_{\text{Bryan}}$

Ejemplos no atómicos

Ejemplo 4

Se elige aleatoriamente un número entre 0 y 1 de manera uniforme. Aquí Ω = [0,1], es el σ-álgebra de conjuntos de Borel en Ω, y P es la medida de Lebesgue en [0,1]. ${\mathcal {F}}$

En este caso, los intervalos abiertos de la forma $(a, b)$ , donde $0 < a < b < 1$ , podrían tomarse como conjuntos generadores. A cada uno de estos conjuntos se le puede atribuir la probabilidad de $P ((a, b)) = (b - a)$ , que genera la medida de Lebesgue en [0,1], y el σ-álgebra de Borel en Ω.

Ejemplo 5

Una moneda justa se lanza al aire sin cesar. Aquí se puede tomar Ω = {0,1} ^∞ , el conjunto de todas las secuencias infinitas de números 0 y 1. Conjuntos de cilindros ${(x 1, x 2, ...) \in Ω : x 1 = a 1, .. ., x n = a n}$ pueden usarse como grupos electrógenos. Cada uno de estos conjuntos describe un evento en el que los primeros $n lanzamientos han dado como resultado una secuencia fija (a 1,..., an$ ) , $y el resto de la secuencia$ puede ser arbitrario. A cada uno de estos eventos se le puede dar naturalmente la probabilidad de 2 ^{− n} .

Estos dos ejemplos no atómicos están estrechamente relacionados: una secuencia $(x 1, x 2, ...) \in {0,1} \infty$ conduce al número $2 -1 x 1 + 2 -2 x 2 + \dots \in [0 ,1]$ . Sin embargo , esta no es una correspondencia uno a uno entre {0,1} ^∞ y [0,1]: es un isomorfismo módulo cero , que permite tratar los dos espacios de probabilidad como dos formas del mismo espacio de probabilidad. De hecho, todos los espacios de probabilidad no atómicos no patológicos son iguales en este sentido. Son los llamados espacios de probabilidad estándar . Las aplicaciones básicas de los espacios de probabilidad son insensibles a la estandarización. Sin embargo, el condicionamiento no discreto es fácil y natural en espacios de probabilidad estándar; de lo contrario, se vuelve oscuro.

Conceptos relacionados

Distribución de probabilidad

Variables aleatorias

Una variable aleatoria X es una función medible X : Ω → S desde el espacio muestral Ω a otro espacio medible S llamado espacio de estados .

Si A ⊂ S , la notación Pr( X ∈ A ) es una abreviatura comúnmente utilizada para . $P(\{\omega \in \Omega :X(\omega )\in A\})$

Definir los eventos en términos del espacio muestral.

Si Ω es contable , casi siempre lo definimos como el conjunto potencia de Ω, es decir, que es trivialmente un álgebra σ y el más grande que podemos crear usando Ω. Por lo tanto, podemos omitir y simplemente escribir (Ω,P) para definir el espacio de probabilidad. ${\mathcal {F}}$ ${\mathcal {F}}=2^{\Omega }$ ${\mathcal {F}}$

Por otro lado, si Ω es incontable y lo usamos, tendremos problemas para definir nuestra medida de probabilidad P porque es demasiado "grande", es decir, a menudo habrá conjuntos a los que será imposible asignar una medida única. En este caso, tenemos que usar una σ-álgebra más pequeña , por ejemplo el álgebra de Borel de Ω, que es la σ-álgebra más pequeña que hace que todos los conjuntos abiertos sean medibles. ${\mathcal {F}}=2^{\Omega }$ ${\mathcal {F}}$ ${\mathcal {F}}$

La probabilidad condicional

La definición de Kolmogorov de espacios de probabilidad da lugar al concepto natural de probabilidad condicional. Cada conjunto $A$ con probabilidad distinta de cero (es decir, $P (A) > 0$ ) define otra medida de probabilidad en el espacio. Esto generalmente se pronuncia como "probabilidad de B dado A ". $P(B\mid A)={P(B\cap A) \over P(A)}$

Para cualquier evento $A$ tal que $P (A) > 0$ , la función $Q$ definida por $Q (B) = P (B | A)$ para todos los eventos $B$ es en sí misma una medida de probabilidad.

Independencia

Se dice que dos eventos, A y B , son independientes si $P (A \cap B) = P (A) P (B)$ .

Se dice que dos variables aleatorias, $X$ e $Y$ , son independientes si cualquier evento definido en términos de $X$ es independiente de cualquier evento definido en términos de $Y.$ Formalmente, generan σ-álgebras independientes, donde se dice que dos σ-álgebras $G$ y $H$ , que son subconjuntos de $F$ , son independientes si cualquier elemento de $G$ es independiente de cualquier elemento de $H.$

Exclusividad mutua

Se dice que dos eventos, $A$ y $B,$ son mutuamente excluyentes o disjuntos si la ocurrencia de uno implica la no ocurrencia del otro, es decir, su intersección es vacía. Esta es una condición más fuerte que la probabilidad de que su intersección sea cero.

Si $A$ y $B$ son eventos disjuntos, entonces $P (A \cup B) = P (A) + P (B)$ . Esto se extiende a una secuencia de eventos (finita o contablemente infinita). Sin embargo, la probabilidad de la unión de un conjunto incontable de eventos no es la suma de sus probabilidades. Por ejemplo, si $Z$ es una variable aleatoria distribuida normalmente , entonces $P (Z = x)$ es 0 para cualquier $x$ , pero $P (Z \in R) = 1$ .

El evento $A \cap B$ se denomina " A y B ", y el evento $A \cup B$ como " A o B ".

Ver también

Referencias

^ Loève, Michel. Teoría de la probabilidad, volumen 1. Nueva York: D. Van Nostrand Company, 1955.
^ Stroock, DW (1999). Teoría de la probabilidad: una visión analítica. Prensa de la Universidad de Cambridge.

Bibliografía

Pierre Simon de Laplace (1812) Teoría analítica de la probabilidad

El primer tratado importante que combina el cálculo con la teoría de la probabilidad, originalmente en francés: Théorie Analytique des Probabilités .

Andrei Nikolajevich Kolmogorov (1950) Fundamentos de la teoría de la probabilidad

El fundamento teórico de la medida moderno de la teoría de la probabilidad; la versión original en alemán ( Grundbegriffe der Wahrscheinlichkeitrechnung ) apareció en 1933.

Harold Jeffreys (1939) La teoría de la probabilidad

Un enfoque empirista y bayesiano de los fundamentos de la teoría de la probabilidad.

Edward Nelson (1987) Teoría de la probabilidad radicalmente elemental

Fundamentos de la teoría de la probabilidad basada en análisis no estándar. Descargable. http://www.math.princeton.edu/~nelson/books.html

Patrick Billingsley : Probabilidad y medida , John Wiley and Sons, Nueva York, Toronto, Londres, 1979.
Henk Tijms (2004) Comprensión de la probabilidad

Una animada introducción a la teoría de la probabilidad para principiantes, Cambridge Univ. Prensa.

David Williams (1991) Probabilidad con martingalas

Una introducción universitaria a la probabilidad teórica de la medida, Universidad de Cambridge. Prensa.

Gut, Allan (2005). Probabilidad: un curso de posgrado . Saltador. ISBN 0-387-22833-0.

enlaces externos

Sazonov, VV (2001) [1994], "Espacio de probabilidad", Enciclopedia de Matemáticas , EMS Press
Animación que demuestra el espacio de probabilidad de los dados.
Laboratorios virtuales de probabilidad y estadística (autor principal Kyle Siegrist), especialmente Espacios de probabilidad
Ciudadano
Espacio de probabilidad completo
Weisstein, Eric W. "Espacio de probabilidad". MundoMatemático .