stringtranslate.com

Contar datos

En estadística , los datos de conteo son un tipo de datos estadísticos que describen cantidades contables , datos que pueden tomar solo los números de conteo , valores enteros no negativos {0, 1, 2, 3, ...}, y donde estos números enteros surgen del conteo en lugar de la clasificación . El tratamiento estadístico de los datos de conteo es distinto del de los datos binarios , en los que las observaciones pueden tomar solo dos valores, generalmente representados por 0 y 1, y de los datos ordinales , que también pueden consistir en números enteros pero donde los valores individuales caen en una escala arbitraria y solo es importante la clasificación relativa. [ ejemplo necesario ]

Contar variables

A un dato de recuento individual se le suele denominar variable de recuento . Cuando se trata a una variable de este tipo como variable aleatoria , se suelen utilizar las distribuciones de Poisson , binomial y binomial negativa para representar su distribución.

Examen gráfico

El examen gráfico de los datos de recuento puede verse facilitado por el uso de transformaciones de datos elegidas para que tengan la propiedad de estabilizar la varianza de la muestra. En particular, la transformación de raíz cuadrada puede utilizarse cuando los datos pueden aproximarse mediante una distribución de Poisson (aunque otras transformaciones tienen propiedades ligeramente mejoradas), mientras que una transformación de seno inverso está disponible cuando se prefiere una distribución binomial .

Relacionar los datos de recuento con otras variables

En este caso, la variable de recuento se trataría como una variable dependiente . Los métodos estadísticos, como los mínimos cuadrados y el análisis de varianza, están diseñados para tratar con variables dependientes continuas. Estos métodos se pueden adaptar para tratar con datos de recuento mediante el uso de transformaciones de datos , como la transformación de raíz cuadrada , pero estos métodos tienen varias desventajas: son aproximados en el mejor de los casos y estiman parámetros que a menudo son difíciles de interpretar.

La distribución de Poisson puede servir de base para algunos análisis de datos de recuento y, en este caso, se puede utilizar la regresión de Poisson . Este es un caso especial de la clase de modelos lineales generalizados que también contiene formas específicas de modelo capaces de utilizar la distribución binomial ( regresión binomial , regresión logística ) o la distribución binomial negativa cuando se violan los supuestos del modelo de Poisson, en particular cuando el rango de valores de recuento es limitado o cuando hay sobredispersión .

Véase también

Lectura adicional