stringtranslate.com

Resumen de siete números

En estadística descriptiva , el resumen de siete números es una colección de siete estadísticas de resumen y es una extensión del resumen de cinco números . Existen tres formas comunes similares.

Al igual que el resumen de cinco números, se puede representar mediante un diagrama de caja modificado , agregando marcas de trama en los "bigotes" para dos de los números adicionales.

Resumen de siete números

Los siguientes percentiles están espaciados (aproximadamente) de manera uniforme bajo una variable distribuida normalmente :

Los tres valores del medio (el cuartil inferior , la mediana y el cuartil superior ) son las estadísticas habituales del resumen de cinco números y son los valores estándar para el cuadro en un diagrama de caja .

Los dos percentiles inusuales en cada extremo se utilizan porque las ubicaciones de los siete valores estarán aproximadamente igualmente espaciadas si los datos se distribuyen normalmente [a] Algunas pruebas estadísticas requieren datos distribuidos normalmente , por lo que los valores graficados proporcionan una verificación visual conveniente para la validez de pruebas posteriores, simplemente escaneando para ver si las marcas para esos siete percentiles parecen estar a distancias iguales en el gráfico.

Obsérvese que mientras que los valores extremos del resumen de cinco números dependen de la cantidad de muestras, este resumen de siete números no depende de ello y es algo más estable, ya que sus extremos están protegidos de las oscilaciones salvajes habituales en los valores extremos de la muestra al reemplazarlos con los percentiles 2 y 98, que son más estables.

Los valores se pueden representar mediante un diagrama de caja modificado . Los percentiles 2 y 98 se representan mediante los extremos de los bigotes, y las marcas de rayado a lo largo de los bigotes marcan los percentiles 9 y 91.

El resumen de siete cifras de Bowley

Arthur Bowley utilizó un conjunto de estadísticas no paramétricas , llamado "resumen de siete cifras", que incluye los extremos, deciles y cuartiles , junto con la mediana. [1]

Así que los números son:

Tenga en cuenta que los cinco números del medio de los siete son casi iguales a los del resumen de siete números anterior.

La adición de los deciles permite calcular el rango interdecil , que para una distribución normal se puede escalar para dar una estimación razonablemente eficiente de la desviación estándar, y el resumen medio del 10% , que cuando se compara con la mediana da una idea de la asimetría en las colas.

Resumen de siete números de Tukey

John Tukey utilizó un resumen de siete números que consta de los extremos, octiles, cuartiles y la mediana. [2]

Los siete números son:

Obsérvese que los cinco números del medio de los siete pueden obtenerse mediante particionamiento sucesivo de los datos ordenados en subconjuntos de igual tamaño. La extensión del resumen de siete números mediante particionamiento continuo produce el resumen de nueve números , el resumen de once números , y así sucesivamente.

Véase también

Notas al pie

  1. ^ Los siete percentiles igualmente espaciados con tres dígitos de precisión son 2,15 %, 8,87 %, 25,0 %, 50,0 %, 75,0 %, 91,13 % y 97,85 %.

Referencias

  1. ^ ab Bowley, A. (1920). Manual elemental de estadística (3.ª ed.). pág. 62. Las siete posiciones son el máximo y el mínimo, la mediana, los cuartiles y dos decilos.
  2. ^ ab Tukey, J. (1977). Análisis exploratorio de datos. pág. 53.