stringtranslate.com

Paradoja de Borel-Kolmogorov

En teoría de la probabilidad , la paradoja de Borel-Kolmogorov (a veces conocida como paradoja de Borel ) es una paradoja relacionada con la probabilidad condicional con respecto a un evento de probabilidad cero (también conocido como conjunto nulo ). Lleva el nombre de Émile Borel y Andrey Kolmogorov .

Un gran rompecabezas circular

Supongamos que una variable aleatoria tiene una distribución uniforme en una esfera unitaria. ¿Cuál es su distribución condicional en un círculo máximo ? Debido a la simetría de la esfera, se podría esperar que la distribución sea uniforme e independiente de la elección de las coordenadas. Sin embargo, dos análisis arrojan resultados contradictorios. Primero, tenga en cuenta que elegir un punto uniformemente en la esfera equivale a elegir la longitud uniformemente y elegir la latitud con densidad . [1] Entonces podemos observar dos grandes círculos diferentes:

  1. Si las coordenadas se eligen de modo que el círculo máximo sea un ecuador (latitud ), la densidad condicional para una longitud definida en el intervalo es
  2. Si el círculo máximo es una línea de longitud con , la densidad condicional para en el intervalo es

Una distribución es uniforme en el círculo, la otra no. Sin embargo, ambos parecen referirse al mismo gran círculo en diferentes sistemas de coordenadas.

Se han desarrollado muchas discusiones bastante inútiles (entre probabilistas por lo demás competentes) sobre cuál de estos resultados es "correcto".

—  ET Jaynes [1]

Explicación e implicaciones.

En el caso (1) anterior, la probabilidad condicional de que la longitud λ se encuentre en un conjunto E dado que φ = 0 se puede escribir P ( λE | φ = 0). La teoría de la probabilidad elemental sugiere que esto se puede calcular como P ( λE y φ = 0)/ P ( φ = 0), pero esa expresión no está bien definida ya que P ( φ = 0) = 0. La teoría de la medida proporciona una manera para definir una probabilidad condicional, utilizando la familia de eventos R ab = { φ  : a < φ < b } que son anillos horizontales que constan de todos los puntos con latitud entre a y b .

La resolución de la paradoja es notar que en el caso (2), P ( φF | λ = 0) se define usando los eventos L ab = { λ  : a < λ < b }, que son lunes (cuñas verticales) , que consta de todos los puntos cuya longitud varía entre a y b . Entonces, aunque P ( λE | φ = 0) y P ( φF | λ = 0) proporcionan cada uno una distribución de probabilidad en un círculo máximo, uno de ellos se define usando anillos y el otro usando lunes. Por lo tanto, después de todo, no es sorprendente que P ( λE | φ = 0) y P ( φF | λ = 0) tengan distribuciones diferentes.

El concepto de probabilidad condicional respecto de una hipótesis aislada cuya probabilidad es igual a 0 es inadmisible. Porque sólo podemos obtener una distribución de probabilidad para [la latitud] en el círculo de meridianos si consideramos este círculo como un elemento de la descomposición de toda la superficie esférica en círculos de meridianos con los polos dados.

... el término 'gran círculo' es ambiguo hasta que especificamos qué operación limitante es para producirlo. El argumento intuitivo de la simetría presupone el límite ecuatorial; sin embargo, que uno coma rodajas de naranja podría presuponer el otro.

—  ET Jaynes [1]

Explicación matemática

Medir la perspectiva teórica.

Para comprender el problema debemos reconocer que una distribución de una variable aleatoria continua se describe mediante una densidad f sólo con respecto a alguna medida μ . Ambos son importantes para la descripción completa de la distribución de probabilidad. O, de manera equivalente, necesitamos definir completamente el espacio en el que queremos definir f .

Sean Φ y Λ dos variables aleatorias que toman valores en Ω 1 = respectivamente Ω 2 = [− π , π ]. Un evento {Φ =  φ , Λ =  λ } da un punto en la esfera S ( r ) con radio r . Definimos la transformación de coordenadas.

para lo cual obtenemos el elemento de volumen

Además, si φ o λ son fijos, obtenemos los elementos de volumen

Dejar

denotamos la medida conjunta en , que tiene una densidad con respecto a y sea

Si suponemos que la densidad es uniforme, entonces

Por lo tanto, tiene una densidad uniforme con respecto a la medida de Lebesgue, pero no con respecto a ella. Por otro lado, tiene una densidad uniforme con respecto a y la medida de Lebesgue.

Prueba de contradicción

Considere un vector aleatorio que está distribuido uniformemente en la esfera unitaria .

Comenzamos parametrizando la esfera con las habituales coordenadas polares esféricas :

dónde y .

Podemos definir variables aleatorias , como los valores de bajo la inversa de esta parametrización, o más formalmente usando la función arctan2 :

Usando las fórmulas para el área de superficie del casquete esférico y la cuña esférica , la superficie de un casquete esférico en cuña viene dada por

Dado que está distribuida uniformemente, la probabilidad es proporcional al área de la superficie, lo que da la función de distribución acumulativa conjunta

La función de densidad de probabilidad conjunta viene dada por

Tenga en cuenta que y son variables aleatorias independientes.

Para simplificar, no calcularemos la distribución condicional completa en un círculo máximo, solo la probabilidad de que el vector aleatorio se encuentre en el primer octante. Es decir, intentaremos calcular la probabilidad condicional con

Intentamos evaluar la probabilidad condicional como límite de condicionamiento sobre los eventos.

Como y son independientes, también lo son los eventos y , por lo tanto

Ahora repetimos el proceso con una parametrización diferente de la esfera:

Esto es equivalente a la parametrización anterior girada 90 grados alrededor del eje y .

Definir nuevas variables aleatorias

La rotación se mide preservando la densidad de y es la misma:

.

Las expresiones para A y B son:

Intentando nuevamente evaluar la probabilidad condicional como límite del condicionamiento sobre los eventos

Utilizando la regla de L'Hôpital y la diferenciación bajo el signo integral :

Esto muestra que la densidad condicional no puede tratarse como un condicionamiento para un evento de probabilidad cero, como se explica en Probabilidad condicional#Condicionamiento para un evento de probabilidad cero .

Ver también

Notas

  1. ^ abc Jaynes 2003, págs. 1514-1517
  2. ^ Originalmente Kolmogorov (1933), traducido en Kolmogorov (1956). Tomado de Pollard (2002)

Referencias