stringtranslate.com

Índice de dispersión

En teoría de probabilidad y estadística , el índice de dispersión , [1] índice de dispersión, coeficiente de dispersión, varianza relativa o relación varianza-media (VMR) , al igual que el coeficiente de variación , es una medida normalizada de la dispersión de una Distribución de probabilidad : es una medida utilizada para cuantificar si un conjunto de sucesos observados está agrupado o disperso en comparación con un modelo estadístico estándar.

Se define como la relación entre la varianza y la media ,

También se conoce como factor de Fano , aunque este término a veces se reserva para datos en ventana (la media y la varianza se calculan sobre una subpoblación), donde el índice de dispersión se usa en el caso especial donde la ventana es infinita. Con frecuencia se realizan ventanas de datos: el VMR se calcula frecuentemente en varios intervalos de tiempo o pequeñas regiones en el espacio, que pueden denominarse "ventanas", y la estadística resultante se denomina factor de Fano.

Solo se define cuando la media es distinta de cero y generalmente solo se usa para estadísticas positivas, como datos de conteo o tiempo entre eventos, o cuando se supone que la distribución subyacente es la distribución exponencial o distribución de Poisson .

Terminología

En este contexto, el conjunto de datos observados puede consistir en los momentos en que ocurren eventos predefinidos, como terremotos en una región determinada con una magnitud determinada, o en las ubicaciones en el espacio geográfico de plantas de una especie determinada. Los detalles de tales sucesos se convierten primero en recuentos del número de sucesos o sucesos en cada una de un conjunto de regiones temporales o espaciales de igual tamaño.

Lo anterior define un índice de dispersión para los conteos . [2] Se aplica una definición diferente para un índice de dispersión para intervalos , [3] donde las cantidades tratadas son la duración de los intervalos de tiempo entre los eventos. El uso común es que "índice de dispersión" significa el índice de dispersión de los recuentos.

Interpretación

Algunas distribuciones, más notablemente la distribución de Poisson , tienen igual varianza y media, lo que les da un VMR = 1. La distribución geométrica y la distribución binomial negativa tienen VMR > 1, mientras que la distribución binomial tiene VMR < 1 y la variable aleatoria constante tiene VMR = 0. Esto produce la siguiente tabla:

Esto puede considerarse análogo a la clasificación de las secciones cónicas por excentricidad ; consulte Acumulantes de distribuciones de probabilidad particulares para obtener más detalles.

La relevancia del índice de dispersión es que tiene un valor de 1 cuando la distribución de probabilidad del número de ocurrencias en un intervalo es una distribución de Poisson . Por tanto, la medida se puede utilizar para evaluar si los datos observados se pueden modelar mediante un proceso de Poisson . Cuando el coeficiente de dispersión es menor que 1, se dice que un conjunto de datos está "subdispersado": esta condición puede relacionarse con patrones de ocurrencia que son más regulares que la aleatoriedad asociada con un proceso de Poisson. Por ejemplo, los acontecimientos regulares y periódicos estarán poco dispersos. Si el índice de dispersión es mayor que 1, se dice que un conjunto de datos está sobredispersado .

Se puede utilizar una estimación del índice de dispersión basada en muestras para construir una prueba de hipótesis estadística formal para comprobar la idoneidad del modelo de que una serie de recuentos siguen una distribución de Poisson. [4] [5] En términos de los recuentos de intervalos, la sobredispersión corresponde a que hay más intervalos con recuentos bajos y más intervalos con recuentos altos, en comparación con una distribución de Poisson: por el contrario, la subdispersión se caracteriza por haber más intervalos con recuentos cercanos al recuento medio, en comparación con una distribución de Poisson.

El VMR también es una buena medida del grado de aleatoriedad de un fenómeno determinado. Por ejemplo, esta técnica se utiliza habitualmente en la gestión de divisas.

Ejemplo

Para partículas que se difunden aleatoriamente ( movimiento browniano ), la distribución del número de partículas dentro de un volumen dado es poissoniana, es decir, VMR = 1. Por lo tanto, para evaluar si un patrón espacial determinado (suponiendo que tenga una manera de medirlo) se debe puramente a la difusión o si está involucrada alguna interacción entre partículas: divida el espacio en parches, Cuadrados o Unidades de muestra (SU), cuente el número de individuos en cada parche o SU, y calcular el VMR. Los VMR significativamente superiores a 1 denotan una distribución agrupada, donde el paseo aleatorio no es suficiente para sofocar el atractivo potencial entre partículas.

Historia

El primero en discutir el uso de una prueba para detectar desviaciones de una distribución de Poisson o binomial parece haber sido Lexis en 1877. Una de las pruebas que desarrolló fue la relación de Lexis .

Este índice fue utilizado por primera vez en botánica por Clapham en 1936.

Si las variables tienen una distribución de Poisson, entonces el índice de dispersión se distribuye como un estadístico χ 2 con n - 1 grados de libertad cuando n es grande y es μ > 3. [6] Para muchos casos de interés, esta aproximación es precisa y Fisher en En 1950 se obtuvo una prueba exacta para ello.

Hoel estudió los primeros cuatro momentos de su distribución. [7] Encontró que la aproximación al estadístico χ 2 es razonable si μ > 5.

Distribuciones asimétricas

Para distribuciones muy asimétricas, puede ser más apropiado utilizar una función de pérdida lineal, en lugar de una cuadrática. El coeficiente de dispersión análogo en este caso es la relación entre la desviación absoluta promedio de la mediana a la mediana de los datos, [8] o, en símbolos:

donde n es el tamaño de la muestra, m es la mediana de la muestra y la suma de toda la muestra. Iowa , Nueva York y Dakota del Sur utilizan este coeficiente lineal de dispersión para estimar las cuotas impositivas. [9] [10] [11]

Para una prueba de dos muestras en la que los tamaños de muestra son grandes, ambas muestras tienen la misma mediana y difieren en la dispersión alrededor de ella, un intervalo de confianza para el coeficiente lineal de dispersión está acotado inferiormente por

donde t j es la desviación absoluta media de la j ésima muestra y z α es la longitud del intervalo de confianza para una distribución normal de confianza α (por ejemplo, para α = 0,05, z α = 1,96). [8]

Ver también

Proporciones similares

Notas

  1. ^ Cox y Lewis (1966)
  2. ^ Cox y Lewis (1966), p72
  3. ^ Cox y Lewis (1966), p71
  4. ^ Cox y Lewis (1966), p158
  5. ^ Upton & Cook (2006), bajo índice de dispersión
  6. ^ Frome, EL (1982). "Algoritmo AS 171: prueba de varianza exacta de Fisher para la distribución de Poisson". Revista de la Royal Statistical Society, Serie C. 31 (1): 67–71. doi :10.2307/2347079. JSTOR  2347079.
  7. ^ Hoel, PG (1943). "Sobre índices de dispersión". Anales de estadística matemática . 14 (2): 155-162. doi : 10.1214/aoms/1177731457 . JSTOR  2235818.
  8. ^ ab Bonett, director general; Seier, E (2006). "Intervalo de confianza para un coeficiente de dispersión en distribuciones no normales". Diario Biométrico . 48 (1): 144-148. doi :10.1002/bimj.200410148. PMID  16544819. S2CID  33665632.
  9. ^ "Definiciones de cálculo estadístico para tasación masiva" (PDF) . Iowa.gov . Archivado desde el original (PDF) el 11 de noviembre de 2010. Proporción mediana: la proporción ubicada a medio camino entre la proporción más alta y la proporción más baja cuando las proporciones individuales para una clase de bienes inmuebles se clasifican en orden ascendente o descendente. El índice mediano se utiliza con mayor frecuencia para determinar el nivel de evaluación de una clase determinada de bienes raíces.
  10. ^ "Evaluación de capital en Nueva York: resultados de la encuesta de valor de mercado de 2010". Archivado desde el original el 6 de noviembre de 2012.
  11. ^ "Resumen del proceso de evaluación" (PDF) . estado.sd.us . Departamento de Ingresos de Dakota del Sur - División de Impuestos Especiales/Propiedad. Archivado desde el original (PDF) el 10 de mayo de 2009.

Referencias