donde el lado derecho representa la probabilidad de que la variable aleatoria tome un valor menor o igual a .
La probabilidad de que se encuentre en el intervalo semicerrado , donde , es por lo tanto [2] : p. 84
En la definición anterior, el signo "menor o igual a", "≤", es una convención, no una de uso universal (por ejemplo, la literatura húngara utiliza "<"), pero la distinción es importante para distribuciones discretas. El uso adecuado de las tablas de las distribuciones binomial y de Poisson depende de esta convención. Además, fórmulas importantes como la fórmula de inversión de Paul Lévy para la función característica también se basan en la formulación "menor o igual a".
Si se tratan varias variables aleatorias, etc., las letras correspondientes se utilizan como subíndices, mientras que, si se trata solo de una, el subíndice suele omitirse. Es convencional utilizar una mayúscula para una función de distribución acumulativa, en contraste con las minúsculas utilizadas para las funciones de densidad de probabilidad y las funciones de masa de probabilidad . Esto se aplica cuando se analizan distribuciones generales: algunas distribuciones específicas tienen su propia notación convencional, por ejemplo, la distribución normal utiliza y en lugar de y , respectivamente.
La función de densidad de probabilidad de una variable aleatoria continua se puede determinar a partir de la función de distribución acumulativa diferenciando [3] utilizando el Teorema Fundamental del Cálculo ; es decir, dado ,
siempre que exista la derivada.
La CDF de una variable aleatoria continua se puede expresar como la integral de su función de densidad de probabilidad de la siguiente manera: [2] : p. 86
En el caso de una variable aleatoria que tiene una distribución que tiene un componente discreto en un valor ,
Si es continua en , esto es igual a cero y no hay ningún componente discreto en .
Propiedades
Toda función de distribución acumulativa es no decreciente [2] : p. 78 y continua por la derecha [2] : p. 79, lo que la convierte en una función càdlàg . Además,
y para cualquier ,
así como
como se muestra en el diagrama (considere las áreas de los dos rectángulos rojos y sus extensiones hacia la derecha o izquierda hasta el gráfico de ). En particular, tenemos
Además, el valor esperado (finito) de la variable aleatoria de valor real se puede definir en el gráfico de su función de distribución acumulativa como se ilustra en el dibujo en la definición de valor esperado para variables aleatorias de valor real arbitrarias .
Aquí el parámetro es la media o expectativa de la distribución; y es su desviación estándar.
Una tabla de la CDF de la distribución normal estándar se utiliza a menudo en aplicaciones estadísticas, donde se denomina tabla normal estándar , tabla normal unitaria o tabla Z.
Aquí está la probabilidad de éxito y la función denota la distribución de probabilidad discreta del número de éxitos en una secuencia de experimentos independientes, y es el "piso" debajo de , es decir, el mayor entero menor o igual a .
Funciones derivadas
Función de distribución acumulativa complementaria (distribución de cola)
A veces, resulta útil estudiar la cuestión opuesta y preguntar con qué frecuencia la variable aleatoria se encuentra por encima de un nivel determinado. Esto se denominafunción de distribución acumulativa complementaria (ccdf ) o simplemente eldistribución de la cola oexcedencia , y se define como
Esto tiene aplicaciones en las pruebas de hipótesis estadísticas , por ejemplo, porque el valor p unilateral es la probabilidad de observar una estadística de prueba al menos tan extrema como la observada. Por lo tanto, siempre que la estadística de prueba , T , tenga una distribución continua, el valor p unilateral se da simplemente por la función de distribución continua de correspondencia: para un valor observado de la estadística de prueba
Para una variable aleatoria continua no negativa que tiene una expectativa, la desigualdad de Markov establece que [4]
Como , y de hecho siempre que sea finito. Prueba: [ cita requerida ] Suponiendo que tiene una función de densidad , para cualquier Entonces, al reconocer y reordenar términos, como se afirma.
Para una variable aleatoria que tiene una expectativa, y para una variable aleatoria no negativa, el segundo término es 0. Si la variable aleatoria solo puede tomar valores enteros no negativos, esto es equivalente a
Distribución acumulativa plegada
Si bien el gráfico de una distribución acumulativa a menudo tiene forma de S, una ilustración alternativa es la distribución acumulativa plegada o gráfico de montaña , que pliega la mitad superior del gráfico, [5] [6] es decir
Si la CDF F es estrictamente creciente y continua, entonces es el único número real tal que . Esto define la función de distribución inversa o función cuantil .
Algunas distribuciones no tienen una única inversa (por ejemplo, si para todos , lo que hace que sea constante). En este caso, se puede utilizar la función de distribución inversa generalizada , que se define como
Ejemplo 1: La mediana es .
Ejemplo 2: Ponemos . Entonces lo llamamos percentil 95.
Algunas propiedades útiles de la función de distribución inversa inversa (que también se conservan en la definición de la función de distribución inversa generalizada) son:
Si es una colección de variables aleatorias distribuidas de forma independiente definidas en el mismo espacio muestral, entonces existen variables aleatorias tales que se distribuyen como y con probabilidad 1 para todos . [ cita requerida ]
La inversa de la función de distribución acumulativa se puede utilizar para traducir los resultados obtenidos para la distribución uniforme a otras distribuciones.
Función de distribución empírica
La función de distribución empírica es una estimación de la función de distribución acumulativa que generó los puntos de la muestra. Converge con probabilidad 1 a esa distribución subyacente. Existen varios resultados que cuantifican la tasa de convergencia de la función de distribución empírica a la función de distribución acumulativa subyacente. [9]
Caso multivariado
Definición de dos variables aleatorias
Cuando se trabaja simultáneamente con más de una variable aleatoria , también se puede definir la función de distribución acumulativa conjunta . Por ejemplo, para un par de variables aleatorias , la CDF conjunta viene dada por [2] : p. 89
donde el lado derecho representa la probabilidad de que la variable aleatoria tome un valor menor o igual a y que tome un valor menor o igual a .
Ejemplo de función de distribución acumulativa conjunta:
Para dos variables continuas X e Y :
Para dos variables aleatorias discretas, es beneficioso generar una tabla de probabilidades y abordar la probabilidad acumulada para cada rango potencial de X e Y , y aquí está el ejemplo: [10]
Dada la función de masa de probabilidad conjunta en forma tabular, determine la función de distribución acumulativa conjunta.
Solución: utilizando la tabla de probabilidades dada para cada rango potencial de X e Y , la función de distribución acumulativa conjunta se puede construir en forma tabular:
Definición para más de dos variables aleatorias
Para las variables aleatorias , la CDF conjunta viene dada por
Interpretar las variables aleatorias como un vector aleatorio produce una notación más corta:
Propiedades
Cada CDF multivariante es:
Monótonamente no decreciente para cada una de sus variables,
Derecha-continua en cada una de sus variables,
No todas las funciones que satisfacen las cuatro propiedades anteriores son una CDF multivariable, a diferencia del caso de dimensión única. Por ejemplo, sea para o o y sea en caso contrario. Es fácil ver que se cumplen las condiciones anteriores, y sin embargo no es una CDF ya que si lo fuera, entonces, como se explica a continuación.
La probabilidad de que un punto pertenezca a un hiperrectángulo es análoga al caso unidimensional: [11]
Caso complejo
Variable aleatoria compleja
La generalización de la función de distribución acumulativa de variables aleatorias reales a complejas no es obvia porque las expresiones de la forma no tienen sentido. Sin embargo, las expresiones de la forma sí tienen sentido. Por lo tanto, definimos la distribución acumulativa de una variable aleatoria compleja a través de la distribución conjunta de sus partes reales e imaginarias:
Vector aleatorio complejo
La generalización de la ecuación 4 da como resultado
una definición para el CDS de un vector aleatorio complejo .
Uso en análisis estadístico
El concepto de función de distribución acumulativa aparece explícitamente en el análisis estadístico de dos maneras (similares). El análisis de frecuencia acumulativa es el análisis de la frecuencia de ocurrencia de valores de un fenómeno menores que un valor de referencia. La función de distribución empírica es una estimación directa formal de la función de distribución acumulativa para la cual se pueden derivar propiedades estadísticas simples y que puede formar la base de varias pruebas de hipótesis estadísticas . Dichas pruebas pueden evaluar si hay evidencia en contra de que una muestra de datos haya surgido de una distribución dada, o evidencia en contra de que dos muestras de datos hayan surgido de la misma distribución de población (desconocida).
Pruebas de Kolmogorov-Smirnov y Kuiper
La prueba de Kolmogorov-Smirnov se basa en funciones de distribución acumulativa y se puede utilizar para comprobar si dos distribuciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal. La prueba de Kuiper, estrechamente relacionada , es útil si el dominio de la distribución es cíclico, como en el caso de los días de la semana. Por ejemplo, la prueba de Kuiper se puede utilizar para comprobar si la cantidad de tornados varía durante el año o si las ventas de un producto varían según el día de la semana o el día del mes.
^ Deisenroth, Marc Peter; Faisal, A. Aldo; Ong, Cheng Soon (2020). Matemáticas para el aprendizaje automático. Cambridge University Press. pág. 181. ISBN 9781108455145.
^ abcdef Park, Kun Il (2018). Fundamentos de probabilidad y procesos estocásticos con aplicaciones a las comunicaciones . Springer. ISBN978-3-319-68074-3.
^ Montgomery, Douglas C.; Runger, George C. (2003). Estadística aplicada y probabilidad para ingenieros (PDF) . John Wiley & Sons, Inc. pág. 104. ISBN0-471-20454-4. Archivado (PDF) del original el 30 de julio de 2012.
^ Zwillinger, Daniel; Kokoska, Stephen (2010). Tablas y fórmulas estándar de probabilidad y estadística del CRC . CRC Press. pág. 49. ISBN978-1-58488-059-2.
^ Monti, KL (1995). "Curvas de función de distribución empírica plegadas (gráficos de montaña)". The American Statistician . 49 (4): 342–345. doi :10.2307/2684570. JSTOR 2684570.
^ Xue, JH; Titterington, DM (2011). "La función de distribución acumulativa p-plegada y la desviación absoluta media del p-cuantil" (PDF) . Statistics & Probability Letters . 81 (8): 1179–1182. doi :10.1016/j.spl.2011.03.014.
^ Chan, Stanley H. (2021). Introducción a la probabilidad para la ciencia de datos. Michigan Publishing. pág. 18. ISBN978-1-60785-746-4.
^ Hesse, C. (1990). "Tasas de convergencia para la función de distribución empírica y la función característica empírica de una amplia clase de procesos lineales". Journal of Multivariate Analysis . 35 (2): 186–202. doi :10.1016/0047-259X(90)90024-C.
^ "Función de distribución acumulativa conjunta (CDF)". math.info . Consultado el 11 de diciembre de 2019 .
^ "Copia archivada" (PDF) . www.math.wustl.edu . Archivado desde el original (PDF) el 22 de febrero de 2016 . Consultado el 13 de enero de 2022 .{{cite web}}: CS1 maint: archived copy as title (link)
^ Sun, Jingchao; Kong, Maiying; Pal, Subhadip (22 de junio de 2021). "La distribución seminormal modificada: propiedades y un esquema de muestreo eficiente". Comunicaciones en estadística: teoría y métodos . 52 (5): 1591–1613. doi :10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
Enlaces externos
Medios relacionados con Funciones de distribución acumulativa en Wikimedia Commons