Distribución de probabilidad conjunta

Dadas dos variables aleatorias que están definidas en el mismo espacio de probabilidad , ^[1] la distribución de probabilidad conjunta es la distribución de probabilidad correspondiente en todos los pares posibles de salidas. La distribución conjunta también puede considerarse para cualquier número dado de variables aleatorias. La distribución conjunta codifica las distribuciones marginales , es decir, las distribuciones de cada una de las variables aleatorias individuales y las distribuciones de probabilidad condicional , que tratan de cómo se distribuyen las salidas de una variable aleatoria cuando se da información sobre las salidas de la(s) otra(s) variable(s) aleatoria(s).

En la configuración matemática formal de la teoría de la medida , la distribución conjunta está dada por la medida de empuje hacia adelante , por el mapa obtenido al emparejar las variables aleatorias dadas, de la medida de probabilidad del espacio muestral .

En el caso de variables aleatorias de valor real, la distribución conjunta, como una distribución multivariante particular , puede expresarse mediante una función de distribución acumulativa multivariante o mediante una función de densidad de probabilidad multivariante junto con una función de masa de probabilidad multivariante . En el caso especial de variables aleatorias continuas , es suficiente considerar funciones de densidad de probabilidad y, en el caso de variables aleatorias discretas , es suficiente considerar funciones de masa de probabilidad.

Ejemplos

Extrae de una urna

Cada una de las dos urnas contiene el doble de bolas rojas que de bolas azules, y ninguna otra, y se selecciona una bola al azar de cada urna, y las dos extracciones son independientes entre sí. Sean y variables aleatorias discretas asociadas con los resultados de la extracción de la primera y la segunda urna respectivamente. La probabilidad de extraer una bola roja de cualquiera de las urnas es 2/3, y la probabilidad de extraer una bola azul es 1/3. La distribución de probabilidad conjunta se presenta en la siguiente tabla: $A$ $B$

Cada una de las cuatro celdas internas muestra la probabilidad de una combinación particular de resultados de los dos sorteos; estas probabilidades son la distribución conjunta. En cualquier celda, la probabilidad de que ocurra una combinación particular es (ya que los sorteos son independientes) el producto de la probabilidad del resultado especificado para A y la probabilidad del resultado especificado para B. Las probabilidades en estas cuatro celdas suman 1, como en todas las distribuciones de probabilidad.

Además, la última fila y la última columna dan la distribución de probabilidad marginal para A y la distribución de probabilidad marginal para B respectivamente. Por ejemplo, para A, la primera de estas celdas da la suma de las probabilidades de que A sea rojo, independientemente de qué posibilidad de B en la columna sobre la celda ocurra, como 2/3. Por lo tanto, la distribución de probabilidad marginal para da las probabilidades de incondicionales en , en un margen de la tabla. $A$ $A$ $B$

Lanzamientos de moneda

Consideremos el lanzamiento de dos monedas justas ; sean y variables aleatorias discretas asociadas con los resultados del primer y segundo lanzamiento de moneda respectivamente. Cada lanzamiento de moneda es un ensayo de Bernoulli y tiene una distribución de Bernoulli . Si una moneda muestra "cara", entonces la variable aleatoria asociada toma el valor 1, y toma el valor 0 en caso contrario. La probabilidad de cada uno de estos resultados es 1/2, por lo que las funciones de densidad marginales (incondicionales) son $A$ $B$

P(A)=1/2\quad {\text{for}}\quad A\in \{0,1\};

P(B)=1/2\quad {\text{for}}\quad B\in \{0,1\}.

La función de masa de probabilidad conjunta de y define las probabilidades para cada par de resultados. Todos los resultados posibles son $A$ $B$

(A=0,B=0),(A=0,B=1),(A=1,B=0),(A=1,B=1).

Dado que cada resultado es igualmente probable, la función de masa de probabilidad conjunta se convierte en

P(A,B)=1/4\quad {\text{for}}\quad A,B\in \{0,1\}.

Dado que los lanzamientos de moneda son independientes, la función de masa de probabilidad conjunta es el producto de los marginales:

P(A,B)=P(A)P(B)\quad {\text{for}}\quad A,B\in \{0,1\}.

Tirar un dado

Considere el lanzamiento de un dado justo y suponga que el número es par (es decir, 2, 4 o 6) y en los demás casos. Además, suponga que el número es primo (es decir, 2, 3 o 5) y en los demás casos. $A=1$ $A=0$ $B=1$ $B=0$

Entonces, la distribución conjunta de y , expresada como una función de masa de probabilidad, es $A$ $B$

\mathrm {P} (A=0,B=0)=P\{1\}={\frac {1}{6}},\quad \quad \mathrm {P} (A=1,B=0)=P\{4,6\}={\frac {2}{6}},

\mathrm {P} (A=0,B=1)=P\{3,5\}={\frac {2}{6}},\quad \quad \mathrm {P} (A=1,B=1)=P\{2\}={\frac {1}{6}}.

Estas probabilidades necesariamente suman 1, ya que la probabilidad de que ocurra alguna combinación de y es 1. $A$ $B$

Distribución de probabilidad marginal

Si se define más de una variable aleatoria en un experimento aleatorio, es importante distinguir entre la distribución de probabilidad conjunta de X e Y y la distribución de probabilidad de cada variable individualmente. La distribución de probabilidad individual de una variable aleatoria se denomina distribución de probabilidad marginal. En general, la distribución de probabilidad marginal de X se puede determinar a partir de la distribución de probabilidad conjunta de X y otras variables aleatorias.

Si la función de densidad de probabilidad conjunta de las variables aleatorias X e Y es , la función de densidad de probabilidad marginal de X e Y, que define la distribución marginal , viene dada por: $f_{X,Y}(x,y)$

$f_{X}(x)=\int f_{X,Y}(x,y)\;dy$
$f_{Y}(y)=\int f_{X,Y}(x,y)\;dx$

donde la primera integral es sobre todos los puntos en el rango de (X,Y) para los cuales X=x y la segunda integral es sobre todos los puntos en el rango de (X,Y) para los cuales Y=y. ^[2]

Función de distribución acumulativa conjunta

Para un par de variables aleatorias , la función de distribución acumulativa conjunta (CDF) viene dada por ^[3]^{: p. 89} $X,Y$ $F_{X,Y}$

donde el lado derecho representa la probabilidad de que la variable aleatoria tome un valor menor o igual a y que tome un valor menor o igual a . $X$ $x$ $Y$ $y$

Para las variables aleatorias , la CDF conjunta viene dada por $N$ $X_{1},\ldots ,X_{N}$ $F_{X_{1},\ldots ,X_{N}}$

Interpretar las variables aleatorias como un vector aleatorio produce una notación más corta: $N$ $\mathbf {X} =(X_{1},\ldots ,X_{N})^{T}$

F_{\mathbf {X} }(\mathbf {x} )=\operatorname {P} (X_{1}\leq x_{1},\ldots ,X_{N}\leq x_{N})

Función de densidad conjunta o función de masa

Caso discreto

La función de masa de probabilidad conjunta de dos variables aleatorias discretas es: $X,Y$

o escrito en términos de distribuciones condicionales

p_{X,Y}(x,y)=\mathrm {P} (Y=y\mid X=x)\cdot \mathrm {P} (X=x)=\mathrm {P} (X=x\mid Y=y)\cdot \mathrm {P} (Y=y)

¿Dónde está la probabilidad de dado que ? $\mathrm {P} (Y=y\mid X=x)$ $Y=y$ $X=x$

La generalización del caso anterior de dos variables es la distribución de probabilidad conjunta de variables aleatorias discretas que es: $n\,$ $X_{1},X_{2},\dots ,X_{n}$

o equivalentemente

{\begin{aligned}p_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})&=\mathrm {P} (X_{1}=x_{1})\cdot \mathrm {P} (X_{2}=x_{2}\mid X_{1}=x_{1})\\&\cdot \mathrm {P} (X_{3}=x_{3}\mid X_{1}=x_{1},X_{2}=x_{2})\\&\dots \\&\cdot P(X_{n}=x_{n}\mid X_{1}=x_{1},X_{2}=x_{2},\dots ,X_{n-1}=x_{n-1}).\end{aligned}}

Esta identidad se conoce como la regla de la cadena de probabilidad .

Dado que se trata de probabilidades, en el caso de dos variables

\sum _{i}\sum _{j}\mathrm {P} (X=x_{i}\ \mathrm {and} \ Y=y_{j})=1,\,

que se generaliza para variables aleatorias discretas a $n\,$ $X_{1},X_{2},\dots ,X_{n}$

\sum _{i}\sum _{j}\dots \sum _{k}\mathrm {P} (X_{1}=x_{1i},X_{2}=x_{2j},\dots ,X_{n}=x_{nk})=1.\;

Caso continuo

La función de densidad de probabilidad conjunta para dos variables aleatorias continuas se define como la derivada de la función de distribución acumulativa conjunta (ver ecuación 1 ): $f_{X,Y}(x,y)$

Esto es igual a:

f_{X,Y}(x,y)=f_{Y\mid X}(y\mid x)f_{X}(x)=f_{X\mid Y}(x\mid y)f_{Y}(y)

donde y son las distribuciones condicionales de dado y de dado respectivamente, y y son las distribuciones marginales para y respectivamente. $f_{Y\mid X}(y\mid x)$ $f_{X\mid Y}(x\mid y)$ $Y$ $X=x$ $X$ $Y=y$ $f_{X}(x)$ $f_{Y}(y)$ $X$ $Y$

La definición se extiende naturalmente a más de dos variables aleatorias:

Nuevamente, dado que se trata de distribuciones de probabilidad, uno tiene

\int _{x}\int _{y}f_{X,Y}(x,y)\;dy\;dx=1

respectivamente

\int _{x_{1}}\ldots \int _{x_{n}}f_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})\;dx_{n}\ldots \;dx_{1}=1

Caso mixto

La "densidad mixta conjunta" puede definirse cuando una o más variables aleatorias son continuas y las otras variables aleatorias son discretas. Con una variable de cada tipo

{\begin{aligned}f_{X,Y}(x,y)=f_{X\mid Y}(x\mid y)\mathrm {P} (Y=y)=\mathrm {P} (Y=y\mid X=x)f_{X}(x).\end{aligned}}

Un ejemplo de una situación en la que se puede desear encontrar la distribución acumulativa de una variable aleatoria que es continua y otra variable aleatoria que es discreta surge cuando se desea utilizar una regresión logística para predecir la probabilidad de un resultado binario Y condicional al valor de un resultado distribuido continuamente . Se debe utilizar la densidad conjunta "mixta" al encontrar la distribución acumulativa de este resultado binario porque las variables de entrada se definieron inicialmente de tal manera que no se podía asignar colectivamente ni una función de densidad de probabilidad ni una función de masa de probabilidad. Formalmente, es la función de densidad de probabilidad de con respecto a la medida del producto en los respectivos soportes de y . Cualquiera de estas dos descomposiciones se puede utilizar entonces para recuperar la función de distribución acumulativa conjunta: $X$ $(X,Y)$ $f_{X,Y}(x,y)$ $(X,Y)$ $X$ $Y$

{\begin{aligned}F_{X,Y}(x,y)&=\sum \limits _{t\leq y}\int _{s=-\infty }^{x}f_{X,Y}(s,t)\;ds.\end{aligned}}

La definición se generaliza a una mezcla de números arbitrarios de variables aleatorias discretas y continuas.

Propiedades adicionales

Distribución conjunta de variables independientes

En general, dos variables aleatorias y son independientes si y solo si la función de distribución acumulativa conjunta satisface $X$ $Y$

F_{X,Y}(x,y)=F_{X}(x)\cdot F_{Y}(y)

Dos variables aleatorias discretas y son independientes si y solo si la función de masa de probabilidad conjunta satisface $X$ $Y$

P(X=x\ {\mbox{and}}\ Y=y)=P(X=x)\cdot P(Y=y)

para todos y . $x$ $y$

A medida que el número de eventos aleatorios independientes crece, el valor de probabilidad conjunta relacionada disminuye rápidamente a cero, de acuerdo con una ley exponencial negativa.

De manera similar, dos variables aleatorias absolutamente continuas son independientes si y sólo si

f_{X,Y}(x,y)=f_{X}(x)\cdot f_{Y}(y)

para todos y . Esto significa que la adquisición de cualquier información sobre el valor de una o más de las variables aleatorias conduce a una distribución condicional de cualquier otra variable que sea idéntica a su distribución incondicional (marginal); por lo tanto, ninguna variable proporciona información sobre ninguna otra variable. $x$ $y$

Distribución conjunta para variables condicionalmente dependientes

Si un subconjunto de las variables es condicionalmente dependiente dado otro subconjunto de estas variables, entonces la función de masa de probabilidad de la distribución conjunta es . es igual a . Por lo tanto, puede representarse eficientemente mediante las distribuciones de probabilidad de menor dimensión y . Tales relaciones de independencia condicional pueden representarse con una red bayesiana o funciones de cópula . $A$ $X_{1},\cdots ,X_{n}$ $B$ $\mathrm {P} (X_{1},\ldots ,X_{n})$ $\mathrm {P} (X_{1},\ldots ,X_{n})$ $P(B)\cdot P(A\mid B)$ $P(B)$ $P(A\mid B)$

Covarianza

Cuando se definen dos o más variables aleatorias en un espacio de probabilidad, resulta útil describir cómo varían entre sí; es decir, resulta útil medir la relación entre las variables. Una medida común de la relación entre dos variables aleatorias es la covarianza. La covarianza es una medida de la relación lineal entre las variables aleatorias. Si la relación entre las variables aleatorias no es lineal, la covarianza podría no ser sensible a la relación, lo que significa que no relaciona la correlación entre dos variables.

La covarianza entre las variables aleatorias X e Y, denotada como cov(X,Y), es:

$\sigma _{XY}=E[(X-\mu _{x})(Y-\mu _{y})]=E(XY)-\mu _{x}\mu _{y}$ ^[4]

Correlación

Hay otra medida de la relación entre dos variables aleatorias que a menudo es más fácil de interpretar que la covarianza.

La correlación simplemente escala la covarianza por el producto de la desviación estándar de cada variable. En consecuencia, la correlación es una cantidad adimensional que se puede utilizar para comparar las relaciones lineales entre pares de variables en diferentes unidades. Si los puntos en la distribución de probabilidad conjunta de X e Y que reciben probabilidad positiva tienden a caer a lo largo de una línea de pendiente positiva (o negativa), ρ _XY está cerca de +1 (o −1). Si ρ _XY es igual a +1 o −1, se puede demostrar que los puntos en la distribución de probabilidad conjunta que reciben probabilidad positiva caen exactamente a lo largo de una línea recta. Se dice que dos variables aleatorias con correlación distinta de cero están correlacionadas. De manera similar a la covarianza, la correlación es una medida de la relación lineal entre variables aleatorias.

La correlación entre la variable aleatoria X e Y, denotada como

$\rho _{XY}={\frac {cov(X,Y)}{\sqrt {V(X)V(Y)}}}={\frac {\sigma _{XY}}{\sigma _{X}\sigma _{Y}}}$

Distribuciones con nombre importantes

Las distribuciones conjuntas con nombre que surgen con frecuencia en estadística incluyen la distribución normal multivariada , la distribución estable multivariada , la distribución multinomial , la distribución multinomial negativa , la distribución hipergeométrica multivariada y la distribución elíptica .

Véase también

Referencias

^ Feller, William (1957). Introducción a la teoría de la probabilidad y sus aplicaciones, vol. 1, 3.ª edición , págs. 217-218. ISBN 978-0471257080.
^ Montgomery, Douglas C. (19 de noviembre de 2013). Estadística aplicada y probabilidad para ingenieros . Runger, George C. (Sexta edición). Hoboken, NJ. ISBN 978-1-118-53971-2.OCLC 861273897 .{{cite book}}: CS1 maint: location missing publisher (link)
^ Park, Kun Il (2018). Fundamentos de probabilidad y procesos estocásticos con aplicaciones a las comunicaciones . Springer. ISBN 978-3-319-68074-3.
^ Montgomery, Douglas C. (19 de noviembre de 2013). Estadística aplicada y probabilidad para ingenieros . Runger, George C. (Sexta edición). Hoboken, NJ. ISBN 978-1-118-53971-2.OCLC 861273897 .{{cite book}}: CS1 maint: location missing publisher (link)

Enlaces externos

"Distribución conjunta", Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
"Distribución multidimensional", Enciclopedia de Matemáticas , EMS Press , 2001 [1994]
Una introducción moderna a la probabilidad y la estadística: comprender por qué y cómo . Dekking, Michel, 1946-. Londres: Springer. 2005. ISBN 978-1-85233-896-1 . OCLC 262680588.
"Función de densidad continua conjunta". PlanetMath .
Mathworld: Función de distribución conjunta