Trama P–P

En estadística, un gráfico P–P ( gráfico de probabilidad–probabilidad , gráfico de porcentaje–porcentaje o gráfico de valor P ) es un gráfico de probabilidad para evaluar en qué medida coinciden dos conjuntos de datos o para evaluar en qué medida un conjunto de datos se ajusta a un modelo en particular. Funciona trazando las dos funciones de distribución acumulativa una contra la otra; si son similares, los datos parecerán ser casi una línea recta. Este comportamiento es similar al del gráfico Q–Q más utilizado , con el que a menudo se confunde.

Definición

El gráfico AP–P representa dos funciones de distribución acumulativa (cdf) una contra la otra: ^[1] dadas dos distribuciones de probabilidad, con cdf " F " y " G ", se representa como z varía de a Como una cdf tiene un rango [0,1], el dominio de este gráfico paramétrico es y el rango es el cuadrado unitario. $(F(z),G(z))$ ${\estilo de visualización -\infty}$ ${\estilo de visualización \infty .}$ ${\estilo de visualización (-\infty ,\infty )}$ $[0,1]\times [0,1].$

Por lo tanto, para la entrada z, la salida es el par de números que indican qué porcentaje de f y qué porcentaje de g caen en z o por debajo de él.

La línea de comparación es la línea de 45° que va de (0,0) a (1,1), y las distribuciones son iguales si y solo si el gráfico cae sobre esta línea. El grado de desviación permite identificar visualmente con facilidad cuán diferentes son las distribuciones, pero debido al error de muestreo, incluso las muestras extraídas de distribuciones idénticas no parecerán idénticas. ^[2]

Ejemplo

Por ejemplo, si las dos distribuciones no se superponen, digamos que F está debajo de G, entonces el gráfico P–P se moverá de izquierda a derecha a lo largo de la parte inferior del cuadrado (a medida que z se mueve a través del soporte de F, la cdf de F va de 0 a 1, mientras que la cdf de G permanece en 0) y luego se mueve hacia arriba por el lado derecho del cuadrado (la cdf de F ahora es 1, ya que todos los puntos de F se encuentran debajo de todos los puntos de G, y ahora la cdf de G se mueve de 0 a 1 a medida que z se mueve a través del soporte de G) . (Necesito un gráfico para este párrafo)

Usar

Como ilustra el ejemplo anterior, si dos distribuciones están separadas en el espacio, el gráfico P–P proporcionará muy pocos datos; solo es útil para comparar distribuciones de probabilidad que tienen una ubicación cercana o igual. En particular, pasará por el punto (1/2, 1/2) si y solo si las dos distribuciones tienen la misma mediana .

Los gráficos P–P a veces se limitan a comparaciones entre dos muestras, en lugar de a la comparación de una muestra con una distribución de modelo teórico. ^[3] Sin embargo, son de uso general, en particular cuando las observaciones no están todas modeladas con la misma distribución.

Sin embargo, ha encontrado cierta utilidad en la comparación de una distribución de muestra con una distribución teórica conocida : dadas n muestras, trazar la función de distribución acumulativa teórica continua contra la función de distribución acumulativa empírica produciría un escalón (un escalón cuando z alcanza una muestra), y se llegaría a la parte superior del cuadrado cuando se alcanzara el último punto de datos. En lugar de eso, solo se trazan puntos, trazando los k ésimos puntos observados (en orden: formalmente la estadística de orden k observada) contra el k /( n + 1) cuantil de la distribución teórica. ^[3] Esta elección de "posición de trazado" (elección del cuantil de la distribución teórica) ha ocasionado menos controversia que la elección de los gráficos Q–Q. La bondad de ajuste resultante de la línea de 45° da una medida de la diferencia entre un conjunto de muestra y la distribución teórica.

El gráfico AP–P se puede utilizar como complemento gráfico de las pruebas de ajuste de las distribuciones de probabilidad ^[4]^[5], y se incluyen líneas adicionales en el gráfico para indicar regiones de aceptación específicas o el rango de desviación esperada de la línea 1:1. Existe una versión mejorada del gráfico P–P, denominada gráfico SP o S–P, ^[4]^[5] que utiliza una transformación estabilizadora de varianza para crear un gráfico en el que las variaciones sobre la línea 1:1 deberían ser las mismas en todas las ubicaciones.

Véase también

Diagrama de probabilidad

Referencias

Citas

^ Inferencia estadística no paramétrica de Jean Dickinson Gibbons , Subhabrata Chakraborti, 4.ª edición, CRC Press, 2003, ISBN 978-0-8247-4052-8 , pág. 145
^ Derrick, B; Toher, D; White, P (2016). "Por qué la prueba de Welchs es robusta al error de tipo I". Los métodos cuantitativos para la psicología . 12 (1): 30–38. doi : 10.20982/tqmp.12.1.p030 .
^ ab Pruebas de normalidad, por Henry C. Thode, CRC Press, 2002, ISBN 978-0-8247-9613-6 , Sección 2.2.3, Gráficos de porcentaje a porcentaje, pág. 23
^ de Michael JR (1983) "El gráfico de probabilidad estabilizada". Biometrika , 70(1), 11–17. JSTOR 2335939
^ ab Shorack, GR , Wellner, JA (1986) Procesos empíricos con aplicaciones a la estadística , Wiley. ISBN 0-471-86725-X p248–250

Fuentes

Davidson, Russell; MacKinnon, James (enero de 1998). "Métodos gráficos para investigar el tamaño y la potencia de las pruebas de hipótesis". The Manchester School . 66 (1): 1–26. CiteSeerX 10.1.1.57.4335 . doi :10.1111/1467-9957.00086.