Gráfica de probabilidad normal

El gráfico de probabilidad normal es una técnica gráfica para identificar desviaciones sustanciales de la normalidad . Esto incluye la identificación de valores atípicos , asimetría , curtosis , necesidad de transformaciones y mezclas . Los gráficos de probabilidad normal se componen de datos sin procesar, residuos de ajustes de modelos y parámetros estimados.

En un gráfico de probabilidad normal (también llamado "gráfico normal"), los datos ordenados se representan gráficamente en función de los valores seleccionados para que la imagen resultante parezca cercana a una línea recta si los datos se distribuyen aproximadamente de manera normal. Las desviaciones de una línea recta sugieren desviaciones de la normalidad. El gráfico se puede realizar manualmente utilizando un papel cuadriculado especial , llamado papel de probabilidad normal . En las computadoras modernas, los gráficos normales se realizan comúnmente con software.

El gráfico de probabilidad normal es un caso especial del gráfico de probabilidad Q-Q para una distribución normal. Los cuantiles teóricos se eligen generalmente para aproximar la media o la mediana de las estadísticas de orden correspondientes .

Definición

El gráfico de probabilidad normal se forma al representar gráficamente los datos ordenados frente a una aproximación a las medias o medianas de las estadísticas de orden correspondientes ; consulte rankit . Algunos representan gráficamente los datos en el eje vertical; ^[1] otros representan gráficamente los datos en el eje horizontal. ^[2]^[3]

Distintas fuentes utilizan aproximaciones ligeramente diferentes para los rankits . La fórmula que utiliza la función "qqnorm" en el paquete básico "stats" de R (lenguaje de programación) es la siguiente:

z_{i}=\Phi ^{-1}\left({\frac {ia}{n+1-2a}}\right),

para $i = 1, 2, ..., n$ , donde

a = 3/8

n \leq 10

0,5 para n > 10,

y $Φ -1$ es la función cuantil normal estándar .

Si los datos son consistentes con una muestra de una distribución normal, los puntos deben estar cerca de una línea recta. Como referencia, se puede ajustar una línea recta a los puntos. Cuanto más se alejen los puntos de esta línea, mayor será la indicación de desviación de la normalidad. Si la muestra tiene una media de 0 y una desviación estándar de 1, se podría utilizar una línea que pase por 0 con una pendiente de 1.

Con más puntos, las desviaciones aleatorias de una línea serán menos pronunciadas. Los gráficos normales se utilizan a menudo con tan solo 7 puntos, por ejemplo, para representar gráficamente los efectos en un modelo saturado a partir de un experimento factorial fraccional de 2 niveles . Con menos puntos, resulta más difícil distinguir entre variabilidad aleatoria y una desviación sustancial de la normalidad.

Otras distribuciones

Los gráficos de probabilidad para distribuciones distintas de la normal se calculan exactamente de la misma manera. La función cuantil normal $Φ -1$ simplemente se reemplaza por la función cuantil de la distribución deseada. De esta manera, se puede generar fácilmente un gráfico de probabilidad para cualquier distribución para la que se tenga la función cuantil.

En una familia de distribuciones de escala de ubicación , los parámetros de escala y ubicación de la distribución se pueden estimar a partir de la intersección y la pendiente de la línea. En el caso de otras distribuciones, primero se deben estimar los parámetros antes de poder realizar un gráfico de probabilidad.

Tipos de trama

Se trata de una muestra de tamaño 50 de una distribución normal, representada como un histograma y un gráfico de probabilidad normal.

Gráfico de probabilidad normal de una muestra de una distribución normal: parece bastante directo, al menos cuando se ignoran los pocos valores grandes y pequeños.
Histograma de una muestra de una distribución normal: parece bastante simétrico y unimodal

Se trata de una muestra de tamaño 50 de una distribución sesgada hacia la derecha, representada como un histograma y un gráfico de probabilidad normal.

Gráfico de probabilidad normal de una muestra de una distribución sesgada hacia la derecha: tiene forma de C invertida.
Histograma de una muestra de una distribución sesgada hacia la derecha: parece unimodal y sesgada hacia la derecha.

Se trata de una muestra de tamaño 50 de una distribución uniforme, representada como un histograma y un gráfico de probabilidad normal.

Gráfico de probabilidad normal de una muestra de una distribución uniforme: tiene forma de S.
Histograma de una muestra de una distribución uniforme: parece multimodal y supuestamente aproximadamente simétrico.

Véase también

Referencias

Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.

^ Por ejemplo, Chambers et al. (1983, cap. 6. Evaluación de supuestos distributivos sobre datos, pág. 194).
^ Box, George EP ; Draper, Norman (2007), Superficies de respuesta, mezclas y análisis de crestas (2.ª ed.), Wiley, ISBN 978-0-470-05357-7
^ Titterington, DM; Smith, AFM; Makov, UE (1985), "4. Aprendizaje sobre los parámetros de una mezcla", Análisis estadístico de distribuciones de mezclas finitas , Wiley, ISBN 0-471-90763-4

Lectura adicional

Chambers, John; William Cleveland; Beat Kleiner; Paul Tukey (1983). Métodos gráficos para el análisis de datos . Wadsworth.

Enlaces externos

Wikimedia Commons tiene medios relacionados con Gráficos de probabilidad normal .

Manual de estadística de ingeniería: diagrama de probabilidad normal
Soporte de Statit: Prueba de "casi normalidad": el gráfico de probabilidad