stringtranslate.com

Resumen de cinco números

El resumen de cinco números es un conjunto de estadísticas descriptivas que proporciona información sobre un conjunto de datos. Está formado por los cinco percentiles de muestra más importantes :

  1. el mínimo de la muestra (observación más pequeña)
  2. el cuartil inferior o primer cuartil
  3. la mediana (el valor medio)
  4. el cuartil superior o tercer cuartil
  5. el máximo de la muestra (observación más grande)

Además de la mediana de un único conjunto de datos, existen dos estadísticas relacionadas denominadas cuartiles superior e inferior. Si los datos se colocan en orden, el cuartil inferior ocupa el centro de la mitad inferior de los datos y el cuartil superior ocupa el centro de la mitad superior de los datos. Estos cuartiles se utilizan para calcular el rango intercuartil, que ayuda a describir la dispersión de los datos y a determinar si algún punto de los datos es un valor atípico o no.

Para que existan estas estadísticas, las observaciones deben provenir de una variable univariante que pueda medirse en una escala ordinal, de intervalo o de razón .

Uso y representación

El resumen de cinco números proporciona un resumen conciso de la distribución de las observaciones. Informar cinco números evita la necesidad de decidir sobre la estadística de resumen más apropiada. El resumen de cinco números brinda información sobre la ubicación (a partir de la mediana), la dispersión (a partir de los cuartiles) y el rango (a partir del mínimo y máximo de la muestra) de las observaciones. Dado que informa estadísticas de orden (en lugar de, por ejemplo, la media), el resumen de cinco números es apropiado para mediciones ordinales , así como para mediciones de intervalo y de razón.

Es posible comparar rápidamente varios conjuntos de observaciones comparando sus resúmenes de cinco números, que pueden representarse gráficamente mediante un diagrama de caja .

Además de los puntos mismos, se pueden calcular muchos estimadores L a partir del resumen de cinco números, incluidos rango intercuartil , bisagra media , rango , rango medio y trimeano .

El resumen de cinco números a veces se representa en la siguiente tabla:

Ejemplo

Este ejemplo calcula el resumen de cinco números para el siguiente conjunto de observaciones: 0, 0, 1, 2, 63, 61, 27, 13. Estos son el número de lunas de cada planeta del Sistema Solar .

Resulta útil poner las observaciones en orden ascendente: 0, 0, 1, 2, 13, 27, 61, 63. Hay ocho observaciones, por lo que la mediana es la media de los dos números del medio, (2 + 13)/2 = 7,5. Al dividir las observaciones a ambos lados de la mediana, se obtienen dos grupos de cuatro observaciones. La mediana del primer grupo es el cuartil inferior o primero, y es igual a (0 + 1)/2 = 0,5. La mediana del segundo grupo es el cuartil superior o tercero, y es igual a (27 + 61)/2 = 44. Las observaciones más pequeñas y más grandes son 0 y 63.

Entonces el resumen de cinco números sería 0, 0,5, 7,5, 44, 63.

Ejemplo en R

Es posible calcular el resumen de cinco números en el lenguaje de programación R utilizando la fivenumfunción . La summaryfunción, cuando se aplica a un vector, muestra el resumen de cinco números junto con la media (que en sí no es parte del resumen de cinco números). La función fivenumutiliza un método diferente para calcular percentiles summary.

> lunas <- c ( 0 , 0 , 1 , 2 , 63 , 61 , 27 , 13 ) > fivenum ( lunas ) [1] 0.0 0.5 7.5 44.0 63.0 > resumen ( lunas )  Min. 1er P. Mediana Media 3er Qu. Máx.  0,00 0,75 7,50 20,88 35,50 63,00         

Ejemplo en Python

Este ejemplo de Python utiliza la percentilefunción de la biblioteca numérica numpyy funciona en Python 2 y 3.

importar  numpy  como  npdef  fivenum ( data ) : " " " Resumen de cinco números." " " return np.percentile ( data , [ 0,25,50,75,100 ] , method = " midpoint " )         
>>> lunas  =  [ 0 ,  0 ,  1 ,  2 ,  63 ,  61 ,  27 ,  13 ] >>> print ( fivenum ( lunas )) [ 0. 0.5 7.5 44. 63. ]

Ejemplo en SAS

Puedes utilizar PROC UNIVARIATEen SAS para obtener el resumen de cinco números:

datos fivenum; entrada  x @@; líneas de datos; 1 2 3 4 20 202 392 4 38 20 ; ejecutar;ods seleccionar Cuantiles ; proc datos univariados = fivenum; salida  out = fivenums min = min Q1 = Q1 Q2 = mediana Q3 = Q3 max = max ; ejecutar;proc imprimir datos = cinconumeros ; ejecutar;

Ejemplo en Stata

Un resumen de cinco números de una distribución de datos.
byte de entrada y 0  0  1  2  63  61  27  13 fin de  listatabstat y, estadísticas (min q max)

Véase también

Referencias