stringtranslate.com

Datos agrupados

Los datos agrupados son datos formados agregando observaciones individuales de una variable en grupos, de modo que una distribución de frecuencia de estos grupos sirva como un medio conveniente para resumir o analizar los datos. Hay dos tipos principales de agrupación: agrupación de datos de una variable unidimensional, reemplazando números individuales por recuentos en contenedores; y agrupar variables multidimensionales por algunas de las dimensiones (especialmente por variables independientes ), obteniendo la distribución de dimensiones desagrupadas (especialmente las variables dependientes ).

Ejemplo

La idea de datos agrupados se puede ilustrar considerando el siguiente conjunto de datos sin procesar:

Los datos anteriores se pueden agrupar para construir una distribución de frecuencia de varias maneras. Un método consiste en utilizar intervalos como base.

El valor más pequeño en los datos anteriores es 8 y el más grande es 34. El intervalo de 8 a 34 se divide en subintervalos más pequeños (llamados intervalos de clase ). Para cada intervalo de clase, se cuenta el número de elementos de datos que se encuentran en este intervalo. Este número se llama frecuencia de ese intervalo de clase. Los resultados se tabulan como una tabla de frecuencia de la siguiente manera:

Otro método de agrupar los datos es utilizar algunas características cualitativas en lugar de intervalos numéricos. Por ejemplo, supongamos que en el ejemplo anterior hay tres tipos de estudiantes: 1) Por debajo de lo normal, si el tiempo de respuesta es de 5 a 14 segundos, 2) normal si es entre 15 y 24 segundos, y 3) por encima de lo normal si es de 25 segundos o más, entonces los datos agrupados se ven así:

Otro ejemplo más de agrupación de datos es el uso de algunos valores numéricos de uso común, que de hecho son "nombres" que asignamos a las categorías. Por ejemplo, veamos la distribución por edades de los estudiantes de una clase. Los alumnos podrán tener 10 años, 11 años o 12 años. Estos son los grupos de edad, 10, 11 y 12. Nótese que los alumnos del grupo de edad 10 tienen desde 10 años y 0 días, hasta 10 años y 364 días, y su edad media es de 10,5 años si miramos la edad. en una escala continua. Los datos agrupados se ven así:

Media de datos agrupados

Una estimación, , de la media de la población de la que se extraen los datos se puede calcular a partir de los datos agrupados como:

En esta fórmula, x se refiere al punto medio de los intervalos de clase y f es la frecuencia de clase. Tenga en cuenta que el resultado de esto será diferente de la media muestral de los datos no agrupados. La media de los datos agrupados en el ejemplo anterior se puede calcular de la siguiente manera:


Por tanto, la media de los datos agrupados es


La media de los datos agrupados en el ejemplo 4 anterior se puede calcular de la siguiente manera:


Por tanto, la media de los datos agrupados es

Ver también

Referencias