stringtranslate.com

Gráfico de probabilidad normal

El gráfico de probabilidad normal es una técnica gráfica para identificar desviaciones sustanciales de la normalidad . Esto incluye identificar valores atípicos , asimetría , curtosis , necesidad de transformaciones y mezclas . Los gráficos de probabilidad normal están hechos de datos sin procesar, residuos de ajustes del modelo y parámetros estimados.

Un gráfico de probabilidad normal

En un gráfico de probabilidad normal (también llamado "gráfico normal"), los datos ordenados se trazan frente a los valores seleccionados para que la imagen resultante parezca cercana a una línea recta si los datos se distribuyen aproximadamente normalmente. Las desviaciones de una línea recta sugieren desviaciones de la normalidad. El trazado se puede realizar manualmente utilizando un papel cuadriculado especial , llamado papel de probabilidad normal . En las computadoras modernas, los gráficos normales se crean comúnmente con software.

El gráfico de probabilidad normal es un caso especial del gráfico de probabilidad Q – Q para una distribución normal. Los cuantiles teóricos generalmente se eligen para aproximarse a la media o la mediana de las estadísticas de orden correspondientes .

Definición

El gráfico de probabilidad normal se forma trazando los datos ordenados frente a una aproximación a las medias o medianas de las estadísticas de orden correspondientes ; ver rankingit . Algunos trazan los datos en el eje vertical; [1] otros trazan los datos en el eje horizontal. [2] [3]

Diferentes fuentes utilizan aproximaciones ligeramente diferentes para los rankingits . La fórmula utilizada por la función "qqnorm" en el paquete básico "stats" en R (lenguaje de programación) es la siguiente:

para i = 1, 2, ..., n , donde

a = 3/8 si n  ≤ 10 y
0,5 para norte  > 10,

y Φ −1 es la función cuantil normal estándar .

Si los datos son consistentes con una muestra de una distribución normal, los puntos deben estar cerca de una línea recta. Como referencia se puede ajustar una línea recta a los puntos. Cuanto más se alejan los puntos de esta línea, mayor es el indicio de desviación de la normalidad. Si la muestra tiene media 0 y desviación estándar 1, entonces se podría utilizar una línea que pase por 0 con pendiente 1.

Con más puntos, las desviaciones aleatorias de una línea serán menos pronunciadas. Los gráficos normales se utilizan a menudo con tan solo 7 puntos, por ejemplo, para trazar los efectos en un modelo saturado de un experimento factorial fraccional de 2 niveles . Con menos puntos, resulta más difícil distinguir entre variabilidad aleatoria y una desviación sustancial de la normalidad.

Otras distribuciones

Los gráficos de probabilidad para distribuciones distintas a la normal se calculan exactamente de la misma manera. La función cuantil normal Φ −1 simplemente se reemplaza por la función cuantil de la distribución deseada. De esta manera, se puede generar fácilmente un gráfico de probabilidad para cualquier distribución para la que se tenga la función cuantil.

Con una familia de distribuciones de ubicación-escala , los parámetros de ubicación y escala de la distribución se pueden estimar a partir de la intersección y la pendiente de la línea. Para otras distribuciones, primero se deben estimar los parámetros antes de poder realizar un gráfico de probabilidad.

Tipos de trama

Esta es una muestra de tamaño 50 de una distribución normal, trazada como histograma y como gráfico de probabilidad normal.

Esta es una muestra de tamaño 50 de una distribución sesgada a la derecha, trazada como un histograma y un gráfico de probabilidad normal.

Esta es una muestra de tamaño 50 de una distribución uniforme, trazada como histograma y como gráfico de probabilidad normal.

Ver también

Referencias

Dominio publico Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.

  1. ^ por ejemplo, Chambers et al. (1983, cap. 6. Evaluación de supuestos distributivos sobre datos, p. 194)
  2. ^ Caja, George EP ; Draper, Norman (2007), Superficies de respuesta, mezclas y análisis de crestas (2ª ed.), Wiley, ISBN 978-0-470-05357-7
  3. ^ Titterington, DM; Smith, AFM; Makov, UE (1985), "4. Aprendizaje sobre los parámetros de una mezcla", Análisis estadístico de distribuciones de mezclas finitas , Wiley, ISBN 0-471-90763-4

Otras lecturas

enlaces externos