stringtranslate.com

Variables aleatorias intercambiables

En estadística , una secuencia intercambiable de variables aleatorias (también a veces intercambiables ) [1] es una secuencia X 1X 2X 3 , ... (que puede ser finita o infinitamente larga) cuya distribución de probabilidad conjunta no cambia cuando la las posiciones en la secuencia en la que aparecen un número finito de ellos se modifican. En otras palabras, la distribución conjunta es invariante a la permutación finita. Así, por ejemplo, las secuencias

ambos tienen la misma distribución de probabilidad conjunta.

Está estrechamente relacionado con el uso de variables aleatorias independientes y distribuidas idénticamente en modelos estadísticos. Las secuencias intercambiables de variables aleatorias surgen en casos de muestreo aleatorio simple .

Definición

Formalmente, una secuencia intercambiable de variables aleatorias es una secuencia finita o infinita X 1X 2X 3 , ... de variables aleatorias tal que para cualquier permutación finita σ de los índices 1, 2, 3, ..., ( la permutación actúa sólo sobre un número finito de índices, y el resto es fijo), la distribución de probabilidad conjunta de la secuencia permutada

es la misma que la distribución de probabilidad conjunta de la secuencia original. [1] [2]

(Se dice que una secuencia E 1 , E 2 , E 3 , ... de eventos es intercambiable precisamente si la secuencia de sus funciones indicadoras es intercambiable.) La función de distribución F X 1 ,..., X n ( x 1 , ..., x n ) de una secuencia finita de variables aleatorias intercambiables es simétrica en sus argumentos x 1 , ..., x n . Olav Kallenberg proporcionó una definición apropiada de intercambiabilidad para procesos estocásticos de tiempo continuo. [3] [4]

Historia

El concepto fue introducido por William Ernest Johnson en su libro de 1924 Lógica, Parte III: Los fundamentos lógicos de la ciencia . [5] La intercambiabilidad equivale al concepto de control estadístico introducido por Walter Shewhart también en 1924. [6] [7]

Intercambiabilidad y modelo estadístico iid

La propiedad de intercambiabilidad está estrechamente relacionada con el uso de variables aleatorias independientes e idénticamente distribuidas (iid) en modelos estadísticos. [8] Una secuencia de variables aleatorias que son iid, condicionadas a alguna forma distributiva subyacente, es intercambiable. Esto se deriva directamente de la estructura de la distribución de probabilidad conjunta generada por la forma iid.

Las mezclas de secuencias intercambiables (en particular, secuencias de variables iid) son intercambiables. Lo contrario se puede establecer para secuencias infinitas, a través de un importante teorema de representación de Bruno de Finetti (posteriormente ampliado por otros teóricos de la probabilidad como Halmos y Savage ). [9] Las versiones extendidas del teorema muestran que en cualquier secuencia infinita de variables aleatorias intercambiables, las variables aleatorias son condicionalmente independientes y están distribuidas de manera idéntica , dada la forma distributiva subyacente. Este teorema se expone brevemente a continuación. (El teorema original de De Finetti sólo demostró que esto era cierto para variables indicadoras aleatorias, pero luego se amplió para abarcar todas las secuencias de variables aleatorias). Otra forma de expresar esto es que el teorema de De Finetti caracteriza secuencias intercambiables como mezclas de secuencias iid, mientras que una secuencia intercambiable no necesita ser incondicionalmente iid, puede expresarse como una mezcla de secuencias iid subyacentes. [1]

Esto significa que secuencias infinitas de variables aleatorias intercambiables pueden considerarse de manera equivalente como secuencias de variables aleatorias condicionalmente iid, basadas en alguna forma distributiva subyacente. (Tenga en cuenta que esta equivalencia no se cumple del todo para la intercambiabilidad finita. Sin embargo, para vectores finitos de variables aleatorias existe una aproximación cercana al modelo iid). Una secuencia intercambiable infinita es estrictamente estacionaria y, por lo tanto, una ley de grandes números en la forma de Se aplica el teorema de Birkhoff-Khinchin . [4] Esto significa que a la distribución subyacente se le puede dar una interpretación operativa como la distribución empírica limitante de la secuencia de valores. La estrecha relación entre secuencias intercambiables de variables aleatorias y la forma iid significa que esta última puede justificarse sobre la base de una intercambiabilidad infinita. Esta noción es central para el desarrollo de la inferencia predictiva de Bruno de Finetti y para la estadística bayesiana . También se puede demostrar que es un supuesto fundamental útil en las estadísticas frecuentistas y que vincula los dos paradigmas. [10]

El teorema de representación: esta afirmación se basa en la presentación de O'Neill (2009) en las referencias siguientes. Dada una secuencia infinita de variables aleatorias, definimos la función de distribución empírica límite por

(Este es el límite de Cesàro de las funciones del indicador. En los casos en que el límite de Cesàro no existe, esta función en realidad puede definirse como el límite de Banach de las funciones del indicador, que es una extensión de este límite. Este último límite siempre existe para sumas de funciones indicadoras, de modo que la distribución empírica siempre esté bien definida). Esto significa que para cualquier vector de variables aleatorias en la secuencia tenemos una función de distribución conjunta dada por

Si la función de distribución está indexada por otro parámetro entonces (con las densidades definidas apropiadamente) tenemos

Estas ecuaciones muestran la distribución o densidad conjunta caracterizada como una distribución mixta basada en la distribución empírica limitante subyacente (o un parámetro que indexa esta distribución).

Tenga en cuenta que no todas las secuencias finitas intercambiables son mezclas de iid. Para ver esto, considere muestrear sin reemplazo de un conjunto finito hasta que no queden elementos. La secuencia resultante es intercambiable, pero no una mezcla de iid. De hecho, condicionada a todos los demás elementos de la secuencia, el elemento restante es conocido.

Covarianza y correlación

Las secuencias intercambiables tienen algunas propiedades básicas de covarianza y correlación, lo que significa que generalmente están correlacionadas positivamente. Para secuencias infinitas de variables aleatorias intercambiables, la covarianza entre las variables aleatorias es igual a la varianza de la media de la función de distribución subyacente. [10] Para secuencias intercambiables finitas, la covarianza también es un valor fijo que no depende de las variables aleatorias particulares de la secuencia. Existe un límite inferior más débil que el de la intercambiabilidad infinita y es posible que exista una correlación negativa.

Covarianza para secuencias intercambiables (infinita): si la secuencia es intercambiable, entonces

Covarianza para secuencias intercambiables (finita): si es intercambiable con , entonces

El resultado de la secuencia finita se puede demostrar de la siguiente manera. Usando el hecho de que los valores son intercambiables, tenemos

Luego podemos resolver la desigualdad para obtener la covarianza y obtener el límite inferior indicado. La no negatividad de la covarianza para la secuencia infinita se puede obtener entonces como resultado límite a partir de este resultado de secuencia finita.

La igualdad del límite inferior para secuencias finitas se logra en un modelo de urna simple: una urna contiene 1 canica roja y n  − 1 canicas verdes, y estas se muestrean sin reemplazo hasta que la urna esté vacía. Sea Xi  = 1 si la canica roja se extrae en el i -ésimo intento y 0 en caso contrario . Una secuencia finita que alcanza el límite inferior de covarianza no se puede extender a una secuencia intercambiable más larga. [11]

Ejemplos

Aplicaciones

El extractor de von Neumann es un extractor de aleatoriedad que depende de la intercambiabilidad: proporciona un método para tomar una secuencia intercambiable de 0 y 1 ( ensayos de Bernoulli ), con cierta probabilidad p de 0 y de 1, y producir una secuencia intercambiable (más corta) de 0 y 1 con probabilidad 1/2.

Divida la secuencia en pares que no se superpongan: si los dos elementos del par son iguales (00 u 11), deséchelo; si los dos elementos del par son desiguales (01 o 10), se conserva el primero. Esto produce una secuencia de pruebas de Bernoulli en las que, por intercambiabilidad, las probabilidades de que un par determinado sea 01 o 10 son iguales.

Las variables aleatorias intercambiables surgen en el estudio de la estadística U , particularmente en la descomposición de Hoeffding. [13]

La intercambiabilidad es una suposición clave del método de predicción conforme de inferencia libre de distribución . [14]

Ver también

Notas

  1. ^ abc En resumen, el orden de la secuencia de variables aleatorias no afecta su distribución de probabilidad conjunta.
    • Chow, Yuan Shih y Teicher, Henry, Teoría de la probabilidad. Independencia, intercambiabilidad, martingalas, Springer Texts in Statistics, 3.ª ed., Springer, Nueva York, 1997. xxii+488 págs.  ISBN  0-387-98228-0
  2. ^ Aldous, David J., Intercambiabilidad y temas relacionados , en: École d'Été de Probabilités de Saint-Flour XIII - 1983, Lecture Notes in Math. 1117, págs. 1–198, Springer, Berlín, 1985. ISBN 978-3-540-15203-3 doi :10.1007/BFb0099421 
  3. ^ Diaconis, Persi (2009). "Reseña del libro: simetrías probabilísticas y principios de invariancia (Olav Kallenberg, Springer, Nueva York, 2005)". Boletín de la Sociedad Matemática Estadounidense . Series nuevas. 46 (4): 691–696. doi : 10.1090/S0273-0979-09-01262-2 . SEÑOR  2525743.
  4. ^ ab Kallenberg, O. , Simetrías probabilísticas y principios de invariancia . Springer-Verlag, Nueva York (2005). 510 págs.  ISBN 0-387-25115-4
  5. ^ Zabell (1992)
  6. ^ Barlow y la ironía (1992)
  7. ^ Bergman (2009)
  8. ^ Cordani, LK; Wechsler, S. (2006). «Enseñar la independencia y la intercambiabilidad» (PDF) . Actas de la Conferencia Internacional sobre Enseñanza de Estadística . Den Haag: Asociación Internacional para la Educación Estadística.
  9. ^ Diaconis, P. (1988). "Progresos recientes en las nociones de intercambiabilidad de De Finetti". En Bernardo, JM ; et al. (eds.). Estadística bayesiana . vol. 3. Prensa de la Universidad de Oxford. págs. 111-125. ISBN 0-19-852220-7.
  10. ^ ab O'Neill, B. (2009). "Intercambiabilidad, correlación y efecto Bayes". Revista estadística internacional . 77 (2): 241–250. doi :10.1111/j.1751-5823.2008.00059.x.
  11. ^ Taylor, Robert Lee; Daffer, Peter Z.; Patterson, Ronald F. (1985). Teoremas de límite para sumas de variables aleatorias intercambiables. Rowman y Allanheld. págs. 1-152. ISBN 9780847674350.
  12. ^ Spizzichino, Fabio Modelos de probabilidad subjetiva para vidas . Monografías sobre estadística y probabilidad aplicada, 91. Chapman & Hall/CRC , Boca Raton, FL, 2001. xx+248 págs.  ISBN 1-58488-060-0 
  13. ^ Borovskikh, Yu. V. (1996). "Capítulo 10 Variables dependientes".Estadísticos U en espacios de Banach . Utrecht: VSP. págs. 365–376. ISBN 90-6764-200-2. SEÑOR  1419498.
  14. ^ Shafer, Glenn; Vovk, Vladimir (2008). "Un tutorial sobre predicción conforme". Revista de investigación sobre aprendizaje automático . 9 : 371–421.

Bibliografía