stringtranslate.com

Variable aleatoria

Una variable aleatoria (también llamada cantidad aleatoria , variable aleatoria o variable estocástica ) es una formalización matemática de una cantidad u objeto que depende de eventos aleatorios . [1] El término 'variable aleatoria' puede ser engañoso ya que su definición matemática no es realmente aleatoria ni una variable, [2] sino que es una función de posibles resultados (por ejemplo, las posibles caras superiores de una moneda lanzada al aire, como las caras y colas ) en un espacio muestral (por ejemplo, el conjunto ) a un espacio medible (por ejemplo, en el que 1 corresponde a y −1 corresponde a , respectivamente), a menudo a los números reales.

Este gráfico muestra cómo la variable aleatoria es una función de todos los resultados posibles a valores reales. También muestra cómo se utiliza la variable aleatoria para definir funciones de masa de probabilidad.

Informalmente, la aleatoriedad suele representar algún elemento fundamental del azar, como en la tirada de un dado ; también puede representar incertidumbre, como error de medición . [1] Sin embargo, la interpretación de la probabilidad es filosóficamente complicada, e incluso en casos específicos no siempre es sencilla. El análisis puramente matemático de variables aleatorias es independiente de tales dificultades de interpretación y puede basarse en una configuración axiomática rigurosa.

En el lenguaje matemático formal de la teoría de la medida , una variable aleatoria se define como una función medible desde un espacio de medida de probabilidad (llamado espacio muestral ) hasta un espacio medible . Esto permite considerar la medida pushforward , que se denomina distribución de la variable aleatoria; la distribución es, por tanto, una medida de probabilidad sobre el conjunto de todos los valores posibles de la variable aleatoria. Es posible que dos variables aleatorias tengan distribuciones idénticas pero difieran de manera significativa; por ejemplo, pueden ser independientes .

Es común considerar los casos especiales de variables aleatorias discretas y variables aleatorias absolutamente continuas , correspondientes a si una variable aleatoria se valora en un subconjunto contable o en un intervalo de números reales . Existen otras posibilidades importantes, especialmente en la teoría de procesos estocásticos , en la que es natural considerar secuencias aleatorias o funciones aleatorias . A veces se considera que una variable aleatoria se valora automáticamente en números reales y, en su lugar, las cantidades aleatorias más generales se denominan elementos aleatorios .

Según George Mackey , Pafnuty Chebyshev fue la primera persona "en pensar sistemáticamente en términos de variables aleatorias". [3]

Definición

Una variable aleatoria es una función medible desde un espacio muestral como un conjunto de resultados posibles hasta un espacio medible . La definición axiomática técnica requiere que el espacio muestral sea un espacio muestral de un triple de probabilidad (ver la definición teórica de la medida). Una variable aleatoria a menudo se indica con letras romanas mayúsculas como . [4]

La probabilidad de que tome un valor en un conjunto medible se escribe como

.

Caso estándar

En muchos casos, tiene valor real , es decir . En algunos contextos, el término elemento aleatorio (ver extensiones) se utiliza para indicar una variable aleatoria que no tiene esta forma.

Cuando la imagen (o rango) de es finita o infinitamente contable , la variable aleatoria se llama variable aleatoria discreta [5] : 399  y su distribución es una distribución de probabilidad discreta , es decir, puede describirse mediante una función de masa de probabilidad que asigna una probabilidad a cada valor en la imagen de . Si la imagen es incontablemente infinita (normalmente un intervalo ), entonces se denomina variable aleatoria continua . [6] [7] En el caso especial de que sea absolutamente continuo , su distribución puede describirse mediante una función de densidad de probabilidad , que asigna probabilidades a intervalos; en particular, cada punto individual debe necesariamente tener probabilidad cero para una variable aleatoria absolutamente continua. No todas las variables aleatorias continuas son absolutamente continuas. [8]

Cualquier variable aleatoria puede describirse mediante su función de distribución acumulativa , que describe la probabilidad de que la variable aleatoria sea menor o igual a un determinado valor.

Extensiones

El término "variable aleatoria" en estadística se limita tradicionalmente al caso de valor real ( ). En este caso, la estructura de los números reales permite definir cantidades como el valor esperado y la varianza de una variable aleatoria, su función de distribución acumulativa y los momentos de su distribución.

Sin embargo, la definición anterior es válida para cualquier espacio de valores mensurable . Así, se pueden considerar elementos aleatorios de otros conjuntos , como valores booleanos aleatorios , valores categóricos , números complejos , vectores , matrices , secuencias , árboles , conjuntos , formas , variedades y funciones . Entonces se puede hacer referencia específicamente a una variable aleatoria de tipo o a una variable aleatoria valorada .

Este concepto más general de elemento aleatorio es particularmente útil en disciplinas como la teoría de grafos , el aprendizaje automático , el procesamiento del lenguaje natural y otros campos de las matemáticas discretas y la informática , donde a menudo uno está interesado en modelar la variación aleatoria de datos no numéricos. estructuras . En algunos casos, no obstante, es conveniente representar cada elemento de , utilizando uno o más números reales. En este caso, un elemento aleatorio puede representarse opcionalmente como un vector de variables aleatorias de valor real (todas definidas en el mismo espacio de probabilidad subyacente , lo que permite que las diferentes variables aleatorias covaríen ). Por ejemplo:

Funciones de distribución

Si se da una variable aleatoria definida en el espacio de probabilidad , podemos hacer preguntas como "¿Qué probabilidad hay de que el valor de sea igual a 2?". Esto es lo mismo que la probabilidad del evento que a menudo se escribe como o para abreviar.

Al registrar todas estas probabilidades de resultados de una variable aleatoria se obtiene la distribución de probabilidad de . La distribución de probabilidad "se olvida" del espacio de probabilidad particular utilizado para definir y solo registra las probabilidades de varios valores de salida de . Dicha distribución de probabilidad, si tiene un valor real, siempre puede capturarse mediante su función de distribución acumulativa.

y algunas veces también usando una función de densidad de probabilidad . En términos de teoría de medidas , utilizamos la variable aleatoria para "avanzar" la medida a una medida en . La medida se llama "distribución (de probabilidad) de " o "ley de ".[9] La densidad , la derivada de Radon-Nikodym con respecto a alguna medida de referencia (a menudo , esta medida de referencia es la medida de Lebesgue en el caso de variables aleatorias continuas, o la medida de conteo en el caso de variables aleatorias discretas). El espacio de probabilidad subyacente es un dispositivo técnico utilizado para garantizar la existencia de variables aleatorias, a veces para construirlas, y para definir nociones como correlación y dependencia o independencia basada en una distribución conjunta de dos o más variables aleatorias en el mismo espacio de probabilidad. En la práctica, a menudo se elimina el espacio por completo y simplemente se coloca una medida que asigna la medida 1 a toda la línea real, es decir, se trabaja con distribuciones de probabilidad en lugar de variables aleatorias. Consulte el artículo sobre funciones cuantiles para un desarrollo más completo.

Ejemplos

Variable aleatoria discreta

Considere un experimento en el que se elige una persona al azar. Un ejemplo de variable aleatoria puede ser la altura de la persona. Matemáticamente, la variable aleatoria se interpreta como una función que asigna a la persona su altura. Asociada con la variable aleatoria hay una distribución de probabilidad que permite calcular la probabilidad de que la altura esté en cualquier subconjunto de valores posibles, como la probabilidad de que la altura esté entre 180 y 190 cm, o la probabilidad de que la altura sea menor. de 150 o más de 200 cm.

Otra variable aleatoria puede ser el número de hijos de la persona; esta es una variable aleatoria discreta con valores enteros no negativos. Permite calcular probabilidades para valores enteros individuales (la función de masa de probabilidad (PMF)) o ​​para conjuntos de valores, incluidos conjuntos infinitos. Por ejemplo, el evento de interés puede ser "un número par de niños". Para conjuntos de eventos tanto finitos como infinitos, sus probabilidades se pueden encontrar sumando las PMF de los elementos; es decir, la probabilidad de que haya un número par de hijos es la suma infinita .

En ejemplos como estos, el espacio muestral a menudo se suprime, ya que es matemáticamente difícil de describir, y los posibles valores de las variables aleatorias se tratan como un espacio muestral. Pero cuando se miden dos variables aleatorias en el mismo espacio muestral de resultados, como la altura y el número de niños calculados en las mismas personas aleatorias, es más fácil rastrear su relación si se reconoce que tanto la altura como el número de niños vienen de la misma persona aleatoria, por ejemplo, para poder plantear preguntas sobre si dichas variables aleatorias están correlacionadas o no.

Si son conjuntos contables de números reales y , entonces es una función de distribución discreta. Aquí para , para . Tomando, por ejemplo, una enumeración de todos los números racionales como , se obtiene una función discreta que no es necesariamente una función escalonada (constante por partes).

Lanzamiento de la moneda

Los posibles resultados de un lanzamiento de moneda se pueden describir mediante el espacio muestral . Podemos introducir una variable aleatoria de valor real que modele un pago de $1 por una apuesta exitosa a cara de la siguiente manera:

Si la moneda es una moneda justa , Y tiene una función de masa de probabilidad dada por:

Tirada de dados

Si el espacio muestral es el conjunto de posibles números lanzados en dos dados, y la variable aleatoria de interés es la suma S de los números de los dos dados, entonces S es una variable aleatoria discreta cuya distribución se describe mediante la función de masa de probabilidad trazada como la altura de las columnas de la imagen aquí.

También se puede utilizar una variable aleatoria para describir el proceso de tirar los dados y los posibles resultados. La representación más obvia para el caso de dos dados es tomar el conjunto de pares de números n 1 y n 2 de {1, 2, 3, 4, 5, 6} (que representan los números de los dos dados) como muestra. espacio. El número total obtenido (la suma de los números de cada par) es entonces una variable aleatoria X dada por la función que asigna el par a la suma:

justosf X

Variable aleatoria continua

Formalmente, una variable aleatoria continua es una variable aleatoria cuya función de distribución acumulativa es continua en todas partes. [10] No existen " lagunas ", que corresponderían a números que tienen una probabilidad finita de ocurrir . En cambio, las variables aleatorias continuas casi nunca toman un valor exacto prescrito c (formalmente ), pero existe una probabilidad positiva de que su valor se encuentre en intervalos particulares que pueden ser arbitrariamente pequeños . Las variables aleatorias continuas suelen admitir funciones de densidad de probabilidad (PDF), que caracterizan su CDF y medidas de probabilidad ; tales distribuciones también se denominan absolutamente continuas ; pero algunas distribuciones continuas son singulares o mezclas de una parte absolutamente continua y una parte singular.

Un ejemplo de variable aleatoria continua sería una basada en una ruleta que puede elegir una dirección horizontal. Entonces los valores tomados por la variable aleatoria son direcciones. Podríamos representar estas direcciones por Norte, Oeste, Este, Sur, Sudeste, etc. Sin embargo, suele ser más conveniente asignar el espacio muestral a una variable aleatoria que toma valores que son números reales. Esto se puede hacer, por ejemplo, asignando una dirección a un rumbo en grados en el sentido de las agujas del reloj desde el Norte. Luego, la variable aleatoria toma valores que son números reales del intervalo [0, 360), siendo todas las partes del rango "igualmente probables". En este caso, X = el ángulo girado. Cualquier número real tiene probabilidad cero de ser seleccionado, pero se puede asignar una probabilidad positiva a cualquier rango de valores. Por ejemplo, la probabilidad de elegir un número en [0, 180] es 12 . En lugar de hablar de una función de masa de probabilidad, decimos que la densidad de probabilidad de X es 1/360. La probabilidad de un subconjunto de [0, 360) se puede calcular multiplicando la medida del conjunto por 1/360. En general, la probabilidad de un conjunto para una variable aleatoria continua dada se puede calcular integrando la densidad sobre el conjunto dado.

Más formalmente, dado cualquier intervalo , una variable aleatoria se denomina " variable aleatoria uniforme continua " (CURV) si la probabilidad de que tome un valor en un subintervalo depende sólo de la longitud del subintervalo. Esto implica que la probabilidad de caer en cualquier subintervalo es proporcional a la longitud del subintervalo, es decir, si acdb , se tiene

donde la última igualdad resulta del axioma de probabilidad de unitaridad . La función de densidad de probabilidad de una CURV viene dada por la función indicadora de su intervalo de soporte normalizado por la longitud del intervalo:

intervalo unitariodistribución de probabilidadfunción cuantilnúmero generado aleatoriamentelas propiedades de las funciones de distribución acumulativa

tipo mixto

Una variable aleatoria mixta es una variable aleatoria cuya función de distribución acumulativa no es discreta ni continua en todas partes . [10] Puede realizarse como una mezcla de una variable aleatoria discreta y una variable aleatoria continua; en cuyo caso el CDF será el promedio ponderado de los CDF de las variables componentes. [10]

Un ejemplo de una variable aleatoria de tipo mixto se basaría en un experimento en el que se lanza una moneda y se hace girar la ruleta sólo si el resultado del lanzamiento de la moneda es cara. Si el resultado es cruz, X = −1; de lo contrario, X = el valor de la ruleta como en el ejemplo anterior. Existe una probabilidad de 12 de que esta variable aleatoria tenga el valor −1. Otros rangos de valores tendrían la mitad de probabilidades que el último ejemplo.

En términos más generales, toda distribución de probabilidad en la recta real es una mezcla de una parte discreta, una parte singular y una parte absolutamente continua; ver teorema de descomposición de Lebesgue § Refinamiento . La parte discreta se concentra en un conjunto contable, pero este conjunto puede ser denso (como el conjunto de todos los números racionales).

Definición de teoría de medidas

La definición axiomática más formal de una variable aleatoria implica la teoría de la medida . Las variables aleatorias continuas se definen en términos de conjuntos de números, junto con funciones que asignan dichos conjuntos a probabilidades. Debido a varias dificultades (por ejemplo, la paradoja de Banach-Tarski ) que surgen si tales conjuntos no están suficientemente restringidos, es necesario introducir lo que se denomina sigma-álgebra para restringir los posibles conjuntos sobre los cuales se pueden definir probabilidades. Normalmente, se utiliza un álgebra sigma particular, el álgebra σ de Borel , que permite definir probabilidades sobre cualquier conjunto que pueda derivarse directamente de intervalos continuos de números o mediante un número finito o contablemente infinito de uniones y/. o intersecciones de tales intervalos. [11]

La definición teórica de la medida es la siguiente.

Sea un espacio de probabilidad y un espacio medible . Entonces una variable aleatoria con valor es una función medible , lo que significa que, para cada subconjunto , su preimagen es medible; , dónde . [12] Esta definición nos permite medir cualquier subconjunto en el espacio objetivo observando su preimagen, que, según se supone, es mensurable.

En términos más intuitivos, un miembro de es un resultado posible, un miembro de es un subconjunto mensurable de resultados posibles, la función da la probabilidad de cada subconjunto mensurable, representa el conjunto de valores que la variable aleatoria puede tomar (como el conjunto de números reales), y un miembro de es un subconjunto "de buen comportamiento" (medible) de (aquellos para los cuales se puede determinar la probabilidad). La variable aleatoria es entonces una función de cualquier resultado a una cantidad, de modo que los resultados que conducen a cualquier subconjunto útil de cantidades para la variable aleatoria tienen una probabilidad bien definida.

Cuando es un espacio topológico , entonces la elección más común para el σ-álgebra es el σ-álgebra de Borel , que es el σ-álgebra generada por la colección de todos los conjuntos abiertos en . En tal caso, la variable aleatoria valorada se denomina variable aleatoria valorada . Además, cuando el espacio es la línea real , entonces dicha variable aleatoria de valor real se denomina simplemente variable aleatoria .

Variables aleatorias de valor real

En este caso el espacio de observación es el conjunto de los números reales. Recuerde, es el espacio de probabilidad. Para un espacio de observación real, la función es una variable aleatoria de valor real si

Esta definición es un caso especial de lo anterior porque el conjunto genera el álgebra σ de Borel en el conjunto de números reales, y es suficiente para verificar la mensurabilidad en cualquier conjunto generador. Aquí podemos demostrar la mensurabilidad de este grupo electrógeno utilizando el hecho de que .

Momentos

La distribución de probabilidad de una variable aleatoria suele caracterizarse por un pequeño número de parámetros, que también tienen una interpretación práctica. Por ejemplo, suele ser suficiente saber cuál es su "valor medio". Esto se captura mediante el concepto matemático de valor esperado de una variable aleatoria, denotado y también llamado primer momento . En general, no es igual a . Una vez que se conoce el "valor promedio", se podría preguntar qué tan lejos de este valor promedio están los valores típicos, una pregunta que se responde mediante la varianza y la desviación estándar de una variable aleatoria. Puede verse intuitivamente como un promedio obtenido de una población infinita, cuyos miembros son evaluaciones particulares de .

Matemáticamente, esto se conoce como el problema (generalizado) de los momentos : para una clase dada de variables aleatorias , encuentre una colección de funciones tales que los valores esperados caractericen completamente la distribución de la variable aleatoria .

Los momentos sólo se pueden definir para funciones de valores reales de variables aleatorias (o de valores complejos, etc.). Si la variable aleatoria tiene un valor real, entonces se pueden tomar momentos de la variable misma, que son equivalentes a los momentos de la función de identidad de la variable aleatoria. Sin embargo, incluso para variables aleatorias sin valores reales, se pueden tomar momentos de funciones con valores reales de esas variables. Por ejemplo, para una variable aleatoria categórica X que puede tomar los valores nominales "rojo", "azul" o "verde", se puede construir la función de valor real; esto usa el corchete de Iverson y tiene el valor 1 si tiene el valor "verde", 0 en caso contrario. Luego, se puede determinar el valor esperado y otros momentos de esta función.

Funciones de variables aleatorias

Se puede definir una nueva variable aleatoria Y aplicando una función medible de Borel real a los resultados de una variable aleatoria de valor real . Eso es, . La función de distribución acumulativa de es entonces

Si la función es invertible (es decir, existe, donde es la función inversa de ) y es creciente o decreciente , entonces la relación anterior se puede extender para obtener

Con las mismas hipótesis de invertibilidad de , asumiendo también diferenciabilidad , la relación entre las funciones de densidad de probabilidad se puede encontrar diferenciando ambos lados de la expresión anterior con respecto a , para obtener [10]

Si no hay invertibilidad de pero cada una admite como máximo un número contable de raíces (es decir, un número finito o contablemente infinito de tal que ), entonces la relación anterior entre las funciones de densidad de probabilidad se puede generalizar con

donde , según el teorema de la función inversa . Las fórmulas de densidades no exigen que sean crecientes.

En el enfoque axiomático de la teoría de la medida, si una variable aleatoria es una función medible de Borel , entonces también es una variable aleatoria , ya que la composición de funciones mensurables también es mensurable . (Sin embargo, esto no es necesariamente cierto si Lebesgue es medible . [ cita necesaria ] ) El mismo procedimiento que permitió pasar de un espacio de probabilidad a se puede utilizar para obtener la distribución de .

Ejemplo 1

Sea una variable aleatoria continua de valor real y sea .

Si entonces entonces es así

Si entonces

entonces

Ejemplo 2

Supongamos que es una variable aleatoria con una distribución acumulativa.

donde es un parámetro fijo. Considere la variable aleatoria Entonces,

La última expresión se puede calcular en términos de la distribución acumulada de tan

que es la función de distribución acumulativa (CDF) de una distribución exponencial .

Ejemplo 3

Supongamos que es una variable aleatoria con distribución normal estándar , cuya densidad es

Considere la variable aleatoria. Podemos encontrar la densidad usando la fórmula anterior para un cambio de variables:

En este caso el cambio no es monótono , porque cada valor de tiene dos valores correspondientes de (uno positivo y uno negativo). Sin embargo, debido a la simetría, ambas mitades se transformarán de manera idéntica, es decir,

La transformación inversa es

y su derivada es

Entonces,

Esta es una distribución chi-cuadrado con un grado de libertad .

Ejemplo 4

Supongamos que es una variable aleatoria con distribución normal , cuya densidad es

Considere la variable aleatoria. Podemos encontrar la densidad usando la fórmula anterior para un cambio de variables:

En este caso el cambio no es monótono , porque cada valor de tiene dos valores correspondientes de (uno positivo y uno negativo). A diferencia del ejemplo anterior, en este caso no hay simetría y tenemos que calcular los dos términos distintos:

La transformación inversa es

y su derivada es

Entonces,

Esta es una distribución chi-cuadrado no central con un grado de libertad .

Algunas propiedades

Equivalencia de variables aleatorias

Hay varios sentidos diferentes en los que las variables aleatorias pueden considerarse equivalentes. Dos variables aleatorias pueden ser iguales, iguales casi con seguridad o iguales en distribución.

En orden creciente de importancia, a continuación se proporciona la definición precisa de estas nociones de equivalencia.

Igualdad en la distribución

Si el espacio muestral es un subconjunto de la recta real, las variables aleatorias X e Y son iguales en distribución (denotadas ) si tienen las mismas funciones de distribución:

Para tener la misma distribución, no es necesario definir las variables aleatorias en el mismo espacio de probabilidad. Dos variables aleatorias que tienen funciones generadoras de momentos iguales tienen la misma distribución. Esto proporciona, por ejemplo, un método útil para comprobar la igualdad de ciertas funciones de variables aleatorias independientes distribuidas idénticamente (IID) . Sin embargo, la función generadora de momento existe sólo para distribuciones que tienen una transformada de Laplace definida .

Igualdad casi segura

Dos variables aleatorias X e Y son casi seguramente iguales (denotadas ) si, y sólo si, la probabilidad de que sean diferentes es cero :

Para todos los efectos prácticos de la teoría de la probabilidad, esta noción de equivalencia es tan fuerte como la igualdad real. Está asociado a la siguiente distancia:

donde "ess sup" representa el supremo esencial en el sentido de la teoría de la medida .

Igualdad

Finalmente, las dos variables aleatorias X e Y son iguales si son iguales como funciones en su espacio medible:

Esta noción suele ser la menos útil en la teoría de la probabilidad porque, en la práctica y en la teoría, el espacio de medida subyacente del experimento rara vez se caracteriza explícitamente o incluso es caracterizable.

Convergencia

Un tema importante en estadística matemática consiste en obtener resultados de convergencia para determinadas secuencias de variables aleatorias; por ejemplo, la ley de los grandes números y el teorema del límite central .

Hay varios sentidos en los que una secuencia de variables aleatorias puede converger en una variable aleatoria . Estos se explican en el artículo sobre convergencia de variables aleatorias .

Ver también

Referencias

Citas en línea

  1. ^ ab Blitzstein, Joe; Hwang, Jessica (2014). Introducción a la probabilidad . Prensa CRC. ISBN 9781466575592.
  2. ^ Deisenroth, Marc Peter (2020). Matemáticas para el aprendizaje automático. A. Aldo Faisal, Cheng Soon Ong. Cambridge, Reino Unido: Cambridge University Press. ISBN 978-1-108-47004-9. OCLC  1104219401.
  3. ^ George Mackey (julio de 1980). "El análisis armónico como explotación de la simetría: un estudio histórico". Boletín de la Sociedad Matemática Estadounidense . Series nuevas. 3 (1).
  4. ^ "Variables aleatorias". www.mathsisfun.com . Consultado el 21 de agosto de 2020 .
  5. ^ Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). La práctica de la estadística (2ª ed.). Nueva York: Freeman . ISBN 978-0-7167-4773-4. Archivado desde el original el 9 de febrero de 2005.
  6. ^ "Variables aleatorias". www.stat.yale.edu . Consultado el 21 de agosto de 2020 .
  7. ^ Dekking, Frederik Michel; Kraaikamp, ​​Cornelis; Lopuhaä, Hendrik Paul; Meester, Ludolf Erwin (2005). "Una introducción moderna a la probabilidad y la estadística". Textos Springer en Estadística . doi :10.1007/1-84628-168-7. ISBN 978-1-85233-896-1. ISSN  1431-875X.
  8. ^ L. Castañeda; V. Arunachalam y S. Dharmaraja (2012). Introducción a la probabilidad y procesos estocásticos con aplicaciones. Wiley. pag. 67.ISBN 9781118344941.
  9. ^ Billingsley, Patricio (1995). Probabilidad y medida (3ª ed.). Wiley. pag. 187.ISBN 9781466575592.
  10. ^ abcd Bertsekas, Dimitri P. (2002). Introducción a la probabilidad . Tsitsiklis, John N., Τσιτσικλής, Γιάννης Ν. Belmont, Massachusetts: Athena Scientific. ISBN 188652940X. OCLC  51441829.
  11. ^ Steigerwald, Douglas G. "Economía 245A - Introducción a la teoría de la medida" (PDF) . Universidad de California, Santa Bárbara . Consultado el 26 de abril de 2013 .
  12. ^ Fristedt y Gray (1996, página 11)

Literatura

enlaces externos