stringtranslate.com

Datos agrupados

Los datos agrupados son datos formados mediante la agregación de observaciones individuales de una variable en grupos, de modo que una distribución de frecuencias de estos grupos sirva como un medio conveniente para resumir o analizar los datos. Existen dos tipos principales de agrupación: la agrupación de datos de una variable unidimensional, reemplazando números individuales por conteos en grupos; y la agrupación de variables multidimensionales por algunas de las dimensiones (especialmente por variables independientes ), obteniendo la distribución de dimensiones no agrupadas (especialmente las variables dependientes ).

Ejemplo

La idea de datos agrupados se puede ilustrar considerando el siguiente conjunto de datos sin procesar:

Los datos anteriores se pueden agrupar para construir una distribución de frecuencias de varias maneras. Un método consiste en utilizar intervalos como base.

El valor más pequeño de los datos anteriores es 8 y el más grande es 34. El intervalo de 8 a 34 se divide en subintervalos más pequeños (llamados intervalos de clase ). Para cada intervalo de clase, se cuenta el número de elementos de datos que caen en este intervalo. Este número se denomina frecuencia de ese intervalo de clase. Los resultados se tabulan como una tabla de frecuencias de la siguiente manera:

Otro método para agrupar los datos es utilizar algunas características cualitativas en lugar de intervalos numéricos. Por ejemplo, supongamos que en el ejemplo anterior hay tres tipos de estudiantes: 1) Inferior a lo normal, si el tiempo de respuesta es de 5 a 14 segundos, 2) normal si es de entre 15 y 24 segundos, y 3) superior a lo normal si es de 25 segundos o más; entonces los datos agrupados se verían así:

Otro ejemplo de agrupación de datos es el uso de algunos valores numéricos de uso común, que en realidad son "nombres" que asignamos a las categorías. Por ejemplo, observemos la distribución por edad de los estudiantes de una clase. Los estudiantes pueden tener 10, 11 o 12 años. Estos son los grupos de edad 10, 11 y 12. Observe que los estudiantes del grupo de edad 10 tienen entre 10 años y 0 días y 10 años y 364 días, y su edad promedio es de 10,5 años si observamos la edad en una escala continua. Los datos agrupados se ven así:

Media de datos agrupados

Se puede calcular una estimación, , de la media de la población de la que se extraen los datos a partir de los datos agrupados como:

En esta fórmula, x se refiere al punto medio de los intervalos de clase y f es la frecuencia de clase. Tenga en cuenta que el resultado de esto será diferente de la media de la muestra de los datos no agrupados. La media de los datos agrupados en el ejemplo anterior se puede calcular de la siguiente manera:


Por lo tanto, la media de los datos agrupados es


La media de los datos agrupados en el ejemplo 4 anterior se puede calcular de la siguiente manera:


Por lo tanto, la media de los datos agrupados es

Véase también

Referencias