En teoría de la probabilidad , el teorema de De Finetti establece que las observaciones intercambiables son condicionalmente independientes en relación con alguna variable latente . A esta variable se le podría asignar una distribución de probabilidad epistémica . Recibe su nombre en honor a Bruno de Finetti .
Para el caso especial de una secuencia intercambiable de variables aleatorias de Bernoulli , se establece que dicha secuencia es una " mezcla " de secuencias de variables aleatorias de Bernoulli independientes e idénticamente distribuidas (iid).
Una secuencia de variables aleatorias se denomina intercambiable si la distribución conjunta de la secuencia no cambia ante ninguna permutación de los índices. En general, si bien las variables de la secuencia intercambiable no son independientes en sí mismas , sino solo intercambiables, existe una familia subyacente de variables aleatorias iid. Es decir, existen cantidades subyacentes, generalmente no observables, que son iid: las secuencias intercambiables son mezclas de secuencias iid.
Un estadístico bayesiano suele buscar la distribución de probabilidad condicional de una cantidad aleatoria dada la información. El concepto de intercambiabilidad fue introducido por De Finetti. El teorema de De Finetti explica una relación matemática entre independencia e intercambiabilidad. [1]
Una secuencia infinita
Se dice que una variable aleatoria es intercambiable si para cualquier número natural n y cualquier secuencia finita i 1 , ..., i n y cualquier permutación de la secuencia π:{ i 1 , ..., i n } → { i 1 , ..., i n },
Ambos tienen la misma distribución de probabilidad conjunta .
Si una secuencia distribuida de forma idéntica es independiente , entonces la secuencia es intercambiable; sin embargo, lo inverso es falso: existen variables aleatorias intercambiables que no son estadísticamente independientes, por ejemplo, el modelo de urna de Pólya .
Una variable aleatoria X tiene una distribución de Bernoulli si Pr( X = 1) = p y Pr( X = 0) = 1 − p para algún p ∈ (0, 1).
El teorema de De Finetti establece que la distribución de probabilidad de cualquier secuencia infinita intercambiable de variables aleatorias de Bernoulli es una " mezcla " de las distribuciones de probabilidad de secuencias independientes e idénticamente distribuidas de variables aleatorias de Bernoulli. "Mezcla", en este sentido, significa un promedio ponderado, pero esto no necesariamente significa un promedio ponderado finito o infinitamente numerable (es decir, discreto): puede ser una integral sobre una medida en lugar de una suma.
Más precisamente, supongamos que X 1 , X 2 , X 3 , ... es una secuencia infinita intercambiable de variables aleatorias distribuidas según Bernoulli. Entonces existe una medida de probabilidad m en el intervalo [0, 1] y una variable aleatoria Y tal que
Supongamos que hay una secuencia infinita intercambiable de variables aleatorias de Bernoulli. Entonces son condicionalmente independientes y se distribuyen de manera idéntica dada la sigma-álgebra intercambiable (es decir, la sigma-álgebra que consiste en eventos que son medibles con respecto a e invariantes bajo permutaciones finitas de los índices).
He aquí un ejemplo concreto: construimos una secuencia
de variables aleatorias, "mezclando" dos secuencias iid de la siguiente manera.
Suponemos p = 2/3 con probabilidad 1/2 y p = 9/10 con probabilidad 1/2. Dado el evento p = 2/3, la distribución condicional de la secuencia es que los X i son independientes e idénticamente distribuidos y X 1 = 1 con probabilidad 2/3 y X 1 = 0 con probabilidad 1 − 2/3. Dado el evento p = 9/10, la distribución condicional de la secuencia es que los X i son independientes e idénticamente distribuidos y X 1 = 1 con probabilidad 9/10 y X 1 = 0 con probabilidad 1 − 9/10.
Esto se puede interpretar de la siguiente manera: haga dos monedas sesgadas, una que muestre "cara" con una probabilidad de 2/3 y otra que muestre "cara" con una probabilidad de 9/10. Lance una moneda justa una vez para decidir qué moneda sesgada usar para todos los lanzamientos que se registren. Aquí, "cara" en el lanzamiento i significa X i = 1.
La independencia que se afirma aquí es condicional , es decir, las variables aleatorias de Bernoulli en la secuencia son condicionalmente independientes dado el evento de que p = 2/3, y son condicionalmente independientes dado el evento de que p = 9/10. Pero no son incondicionalmente independientes; están correlacionadas positivamente .
En vista de la fuerte ley de los grandes números , podemos decir que
En lugar de concentrar la probabilidad 1/2 en cada uno de dos puntos entre 0 y 1, la "distribución de mezcla" puede ser cualquier distribución de probabilidad compatible con el intervalo de 0 a 1; cuál es depende de la distribución conjunta de la secuencia infinita de variables aleatorias de Bernoulli.
La definición de intercambiabilidad y el enunciado del teorema también tienen sentido para secuencias de longitud finita.
Pero el teorema no es generalmente cierto en ese caso. Es cierto si la secuencia puede extenderse a una secuencia intercambiable que sea infinitamente larga. El ejemplo más simple de una secuencia intercambiable de variables aleatorias de Bernoulli que no puede extenderse de esa manera es aquella en la que X 1 = 1 − X 2 y X 1 es 0 o 1, cada uno con probabilidad 1/2. Esta secuencia es intercambiable, pero no puede extenderse a una secuencia intercambiable de longitud 3, y mucho menos a una infinitamente larga.
El teorema de De Finetti puede expresarse como un límite categórico en la categoría de núcleos de Markov . [2] [3] [4]
Sea un espacio de Borel estándar , y considérese el espacio de sucesiones en , el producto contable (equipado con el producto sigma-álgebra ).
Dada una permutación finita , denotemos nuevamente por la acción de permutación sobre , así como el núcleo de Markov inducido por ella. En términos de teoría de categorías , tenemos un diagrama con un solo objeto, , y un número contable de flechas, una para cada permutación.
Recordemos ahora que una medida de probabilidad es equivalentemente un núcleo de Markov del espacio medible de un punto. Una medida de probabilidad en es intercambiable si y solo si, como núcleos de Markov, para cada permutación . De manera más general, dado cualquier espacio de Borel estándar , se puede decir que un núcleo de Markov es intercambiable si para cada , es decir, si el siguiente diagrama conmuta,
dando un cono
El teorema de De Finetti puede enunciarse ahora como el hecho de que el espacio de medidas de probabilidad sobre ( mónada de Giry ) forma un cono universal (o límite ). [3] Más en detalle, considere el núcleo de Markov construido de la siguiente manera, utilizando el teorema de extensión de Kolmogorov :
para todos los subconjuntos medibles de . Nótese que podemos interpretar este núcleo como si tomara una medida de probabilidad como entrada y devolviera una secuencia iid en distribuida de acuerdo con . Dado que las secuencias iid son intercambiables, es un núcleo intercambiable en el sentido definido anteriormente. El núcleo no solo forma un cono, sino un cono límite : dado cualquier núcleo intercambiable , existe un núcleo único tal que , es decir, haciendo que el siguiente diagrama conmute:
En particular, para cualquier medida de probabilidad intercambiable en , existe una medida de probabilidad única en (es decir, una medida de probabilidad sobre medidas de probabilidad) tal que , es decir, tal que para todos los subconjuntos mensurables de ,
En otras palabras, es una mezcla de medidas iid en (las formadas por en la integral anterior).
Diaconis y Freedman y Kerns y Szekely han demostrado versiones del teorema de De Finetti para secuencias finitas intercambiables [5] [6] y para secuencias intercambiables de Markov [7] . Dos nociones de intercambiabilidad parcial de matrices, conocidas como intercambiabilidad separada y conjunta, conducen a extensiones del teorema de De Finetti para matrices por parte de Aldous y Hoover [8] .
El teorema computable de De Finetti muestra que si un programa de computadora proporciona una secuencia intercambiable de variables aleatorias reales, entonces se puede recuperar automáticamente un programa que tome muestras de la medida de mezcla. [9]
En el contexto de la probabilidad libre , existe una extensión no conmutativa del teorema de De Finetti que caracteriza secuencias no conmutativas invariantes bajo permutaciones cuánticas. [10]
Se ha descubierto que las extensiones del teorema de De Finetti a los estados cuánticos son útiles en la información cuántica , [11] [12] [13] en temas como la distribución de claves cuánticas [14] y la detección de entrelazamientos . [15] Se puede utilizar una extensión multivariada del teorema de De Finetti para derivar las estadísticas de Bose-Einstein a partir de las estadísticas de partículas clásicas (es decir, independientes). [16]