donde el lado derecho representa la probabilidad de que la variable aleatoria tome un valor menor o igual a .
La probabilidad de que se encuentre en el intervalo semicerrado , donde , es por tanto [2] : p. 84
En la definición anterior, el signo "menor o igual a", "≤", es una convención, no una de uso universal (por ejemplo, la literatura húngara usa "<"), pero la distinción es importante para distribuciones discretas. El uso adecuado de tablas de distribuciones binomial y de Poisson depende de esta convención. Además, fórmulas importantes como la fórmula de inversión de Paul Lévy para la función característica también se basan en la formulación "menor o igual".
Si se tratan varias variables aleatorias, etc., las letras correspondientes se utilizan como subíndices, mientras que, si se trata solo una, generalmente se omite el subíndice. Es convencional utilizar mayúsculas para una función de distribución acumulativa, en contraste con las minúsculas utilizadas para las funciones de densidad de probabilidad y funciones de masa de probabilidad . Esto se aplica cuando se habla de distribuciones generales: algunas distribuciones específicas tienen su propia notación convencional, por ejemplo, la distribución normal usa y en lugar de y , respectivamente.
La función de densidad de probabilidad de una variable aleatoria continua se puede determinar a partir de la función de distribución acumulativa diferenciando [3] usando el Teorema Fundamental del Cálculo ; es decir, dado ,
La CDF de una variable aleatoria continua se puede expresar como la integral de su función de densidad de probabilidad de la siguiente manera: [2] : p. 86
En el caso de una variable aleatoria que tiene una distribución que tiene un componente discreto en un valor ,
Si es continuo en , esto es igual a cero y no hay componente discreto en .
Propiedades
Toda función de distribución acumulativa no es decreciente [2] : p. 78 y continuo a la derecha , [2] : p. 79 lo que la convierte en una función càdlàg . Además,
Aquí el parámetro es la media o expectativa de la distribución; y es su desviación estándar.
Una tabla de la CDF de la distribución normal estándar se utiliza a menudo en aplicaciones estadísticas, donde se denomina tabla normal estándar , tabla normal unitaria o tabla Z.
Aquí está la probabilidad de éxito y la función denota la distribución de probabilidad discreta del número de éxitos en una secuencia de experimentos independientes, y es el "piso" bajo , es decir, el mayor entero menor o igual a .
Funciones derivadas
Función de distribución acumulativa complementaria (distribución de cola)
A veces, es útil estudiar la pregunta opuesta y preguntar con qué frecuencia la variable aleatoria está por encima de un nivel particular. Esto se llama elfunción de distribución acumulativa complementaria (ccdf ) o simplemente eldistribución de la cola oexcedencia , y se define como
Esto tiene aplicaciones en las pruebas de hipótesis estadísticas , por ejemplo, porque el valor p unilateral es la probabilidad de observar una estadística de prueba al menos tan extrema como la observada. Por lo tanto, siempre que el estadístico de prueba , T , tenga una distribución continua, el valor p unilateral viene dado simplemente por la ccdf: para un valor observado del estadístico de prueba
Para una variable aleatoria continua no negativa que tiene una expectativa, la desigualdad de Markov establece que [4]
Como , y de hecho siempre que sea finito. Prueba: [ cita necesaria ] Suponiendo que tiene una función de densidad , para cualquier
Luego, al reconocer
y reorganizar términos,
como se afirma.
Para una variable aleatoria que tiene una expectativa,
y para una variable aleatoria no negativa, el segundo término es 0. Si la variable aleatoria solo puede tomar valores enteros no negativos, esto equivale a
Distribución acumulativa plegada
Si bien el gráfico de una distribución acumulativa a menudo tiene forma de S, una ilustración alternativa es la distribución acumulativa plegada o diagrama de montaña , que dobla la mitad superior del gráfico, [5] [6] es decir
Si el CDF F es estrictamente creciente y continuo, entonces el número real único es tal que . Esto define la función de distribución inversa o función cuantil .
Algunas distribuciones no tienen una inversa única (por ejemplo, if for all , lo que hace que sean constantes). En este caso, se puede utilizar la función de distribución inversa generalizada , que se define como
Ejemplo 1: La mediana es .
Ejemplo 2: Poner . Luego llamamos al percentil 95.
Algunas propiedades útiles de la cdf inversa (que también se conservan en la definición de la función de distribución inversa generalizada) son:
Si es una colección de variables aleatorias distribuidas independientes definidas en el mismo espacio muestral, entonces existen variables aleatorias tales que se distribuyen como y con probabilidad 1 para todas . [ cita necesaria ]
La inversa de la CDF se puede utilizar para traducir los resultados obtenidos para la distribución uniforme a otras distribuciones.
Función de distribución empírica
La función de distribución empírica es una estimación de la función de distribución acumulativa que generó los puntos en la muestra. Converge con probabilidad 1 a esa distribución subyacente. Existen varios resultados para cuantificar la tasa de convergencia de la función de distribución empírica con la función de distribución acumulativa subyacente. [9]
Caso multivariado
Definición de dos variables aleatorias
Cuando se trata simultáneamente con más de una variable aleatoria, también se puede definir la función de distribución acumulativa conjunta . Por ejemplo, para un par de variables aleatorias , la CDF conjunta viene dada por [2] : p. 89
donde el lado derecho representa la probabilidad de que la variable aleatoria tome un valor menor o igual a y que tome un valor menor o igual a .
Ejemplo de función de distribución acumulativa conjunta:
Para dos variables continuas X e Y :
Para dos variables aleatorias discretas, es beneficioso generar una tabla de probabilidades y abordar la probabilidad acumulada para cada rango potencial de X e Y , y aquí está el ejemplo: [10]
dada la función de masa de probabilidad conjunta en forma tabular, determine la función de distribución acumulativa conjunta.
Solución: utilizando la tabla de probabilidades dada para cada rango potencial de X e Y , la función de distribución acumulativa conjunta se puede construir en forma tabular:
Definición para más de dos variables aleatorias
Para variables aleatorias , la CDF conjunta viene dada por
Interpretar las variables aleatorias como un vector aleatorio produce una notación más corta:
Propiedades
Cada CDF multivariante es:
Monótonamente no decreciente para cada una de sus variables,
Continua por la derecha en cada una de sus variables,
No todas las funciones que satisfacen las cuatro propiedades anteriores son una CDF multivariada, a diferencia del caso de una sola dimensión. Por ejemplo, let for o or y let else. Es fácil ver que se cumplen las condiciones anteriores, y aun así no es un CDF ya que si lo fuera, entonces como se explica a continuación.
La probabilidad de que un punto pertenezca a un hiperrectángulo es análoga al caso unidimensional: [11]
La generalización de los rendimientos de la ecuación 4
Uso en análisis estadístico.
El concepto de función de distribución acumulativa aparece explícitamente en el análisis estadístico de dos maneras (similares). El análisis de frecuencia acumulada es el análisis de la frecuencia de ocurrencia de valores de un fenómeno menores que un valor de referencia. La función de distribución empírica es una estimación directa formal de la función de distribución acumulativa para la cual se pueden derivar propiedades estadísticas simples y que puede formar la base de varias pruebas de hipótesis estadísticas . Estas pruebas pueden evaluar si existe evidencia de que una muestra de datos haya surgido de una distribución determinada, o de dos muestras de datos que hayan surgido de la misma distribución de población (desconocida).
Pruebas de Kolmogorov-Smirnov y Kuiper
La prueba de Kolmogorov-Smirnov se basa en funciones de distribución acumulativa y se puede utilizar para comprobar si dos distribuciones empíricas son diferentes o si una distribución empírica es diferente de una distribución ideal. La prueba de Kuiper, estrechamente relacionada , es útil si el dominio de la distribución es cíclico, como en el día de la semana. Por ejemplo, la prueba de Kuiper podría usarse para ver si el número de tornados varía durante el año o si las ventas de un producto varían según el día de la semana o el día del mes.
^ Deisenroth, Marc Peter; Faisal, A. Aldo; Ong, Cheng pronto (2020). Matemáticas para el aprendizaje automático. Prensa de la Universidad de Cambridge. pag. 181.ISBN _ 9781108455145.
^ Parque abcdef, Kun Il (2018). Fundamentos de Probabilidad y Procesos Estocásticos con Aplicaciones a las Comunicaciones . Saltador. ISBN978-3-319-68074-3.
^ Montgomery, Douglas C.; Runger, George C. (2003). Estadística Aplicada y Probabilidad para Ingenieros (PDF) . John Wiley & Sons, Inc. pág. 104.ISBN _0-471-20454-4. Archivado (PDF) desde el original el 30 de julio de 2012.
^ Zwillinger, Daniel; Kokoska, Stephen (2010). Tablas y fórmulas de estadística y probabilidad estándar CRC . Prensa CRC. pag. 49.ISBN _978-1-58488-059-2.
^ Monti, KL (1995). "Curvas de función de distribución empírica plegada (gráficos de montaña)". El estadístico estadounidense . 49 (4): 342–345. doi :10.2307/2684570. JSTOR 2684570.
^ Xue, JH; Titterington, DM (2011). "La función de distribución acumulativa plegada por p y la desviación absoluta media del cuantil p" (PDF) . Cartas de estadística y probabilidad . 81 (8): 1179–1182. doi :10.1016/j.spl.2011.03.014.
^ Chan, Stanley H. (2021). Introducción a la probabilidad para la ciencia de datos. Publicaciones de Michigan. pag. 18.ISBN _978-1-60785-746-4.
^ Hesse, C. (1990). "Tasas de convergencia de la función de distribución empírica y la función característica empírica de una amplia clase de procesos lineales". Revista de análisis multivariado . 35 (2): 186–202. doi :10.1016/0047-259X(90)90024-C.
^ "Función de distribución acumulativa conjunta (CDF)". matemáticas.info . Consultado el 11 de diciembre de 2019 .
^ "Copia archivada" (PDF) . www.math.wustl.edu . Archivado desde el original (PDF) el 22 de febrero de 2016 . Consultado el 13 de enero de 2022 .{{cite web}}: CS1 maint: archived copy as title (link)
^ Sol, Jingchao; Kong, Maiying; Pal, Subhadip (22 de junio de 2021). "La distribución seminormal modificada: propiedades y un esquema de muestreo eficiente". Comunicaciones en Estadística - Teoría y Métodos . 52 (5): 1591-1613. doi :10.1080/03610926.2021.1934700. ISSN 0361-0926. S2CID 237919587.
enlaces externos
Medios relacionados con las funciones de distribución acumulativa en Wikimedia Commons