stringtranslate.com

Prueba C de Cochran

La prueba de Cochran , [1] llamada así por William G. Cochran , es una prueba estadística unilateral de valores atípicos de varianza de límite superior . La prueba C se utiliza para decidir si una única estimación de una varianza (o una desviación estándar ) es significativamente mayor que un grupo de varianzas (o desviaciones estándar) con las que se supone que la única estimación es comparable. La prueba C se analiza en muchos libros de texto [2] [3] [4] y ha sido recomendada por la IUPAC [5] y la ISO . [6] La prueba C de Cochran no debe confundirse con la prueba Q de Cochran , que se aplica al análisis de diseños de bloques aleatorios de dos vías .

La prueba C supone un diseño equilibrado, es decir, el conjunto de datos completo considerado debe constar de series de datos individuales que tengan todas el mismo tamaño. La prueba C supone además que cada serie de datos individual se distribuye normalmente . Aunque principalmente es una prueba de valores atípicos, la prueba C también se utiliza como una alternativa simple para las pruebas de homocedasticidad regulares, como la prueba de Bartlett , la prueba de Levene y la prueba de Brown-Forsythe para comprobar la homogeneidad de las varianzas de un conjunto de datos estadísticos . Una forma aún más sencilla de comprobar la homocedasticidad la proporciona la prueba F max de Hartley , [3] pero la prueba F max de Hartley tiene la desventaja de que solo tiene en cuenta el mínimo y el máximo del rango de varianza, mientras que la prueba C tiene en cuenta todas las varianzas dentro del rango.

Descripción

La prueba C detecta un valor de varianza excepcionalmente grande a la vez. La serie de datos correspondiente se omite entonces del conjunto de datos completo. De acuerdo con la norma ISO 5725 [6], la prueba C puede repetirse hasta que no se detecten más valores de varianza excepcionalmente grandes, pero esta práctica puede conducir a rechazos excesivos si las series de datos subyacentes no se distribuyen normalmente. La prueba C evalúa la relación :

dónde:

C j = estadístico C de Cochran para la serie de datos j
S j = desviación estándar de la serie de datos j
N = número de series de datos que permanecen en el conjunto de datos; N se reduce en pasos de 1 en cada iteración de la prueba C
S i = desviación estándar de la serie de datos i (1 ≤ iN )

La prueba C prueba la hipótesis nula (H 0 ) contra la hipótesis alternativa (H a ):

H 0 : Todas las varianzas son iguales.
H a : Al menos un valor de varianza es significativamente mayor que los otros valores de varianza.

Valores críticos

La varianza de la muestra de la serie de datos j se considera un valor atípico en el nivel de significancia α si C j excede el valor crítico del límite superior C UL . C UL depende del nivel de significancia deseado α , el número de series de datos consideradas N y el número de puntos de datos ( n ) por serie de datos. Se han tabulado selecciones de valores para C UL en niveles de significancia α = 0,01, [6] [7] [8] α = 0,025, [8] y α = 0,05. [6] [7] [8] C UL también se puede calcular a partir de: [8] [9]

Aquí:

C UL = valor crítico límite superior para prueba unilateral en un diseño equilibrado
α = nivel de significancia, p. ej., 0,05
n = número de puntos de datos por serie de datos
F c = valor crítico del coeficiente F de Fisher ; F c se puede obtener a partir de las tablas de la distribución F [10] o utilizando un software de computadora para esta función.

Generalización

La prueba C se puede generalizar para incluir diseños no balanceados, pruebas de límite inferior unilaterales y pruebas bilaterales en cualquier nivel de significancia α , para cualquier número de series de datos N , y para cualquier número de puntos de datos individuales n j en la serie de datos j . [8] [9]

Véase también

Referencias

  1. ^ WG Cochran, La distribución de la mayor de un conjunto de varianzas estimadas como fracción de su total, Annals of Human Genetics (Londres) 11(1), 47–52 (enero de 1941).
  2. ^ DL Massart, BGM Vandeginste, LMC Buydens, S. de Jong, PJ Lewi, J. Smeyers-Verbeke, Manual de quimiometría y cualimetría : Parte A, Elsevier, Ámsterdam, Países Bajos, 1997 ISBN  0-444-89724-0 .
  3. ^ ab P. Konieczka, J. Namieśnik, Garantía de calidad y control de calidad en el laboratorio químico analítico: un enfoque práctico, CRC Press, Boca Raton, Florida, 2009; ISBN 978-1-4200-8270-8
  4. ^ JK Taylor, Garantía de calidad de las mediciones químicas, cuarta impresión, Lewis Publishers, Chelsea, Michigan, 1988; ISBN 0-87371-097-5
  5. ^ W. Horwitz , Protocolo armonizado para el diseño e interpretación de estudios colaborativos, Trends in Analytical Chemistry 7(4), 118–120 (abril de 1988).
  6. ^ abcd Norma ISO 5725–2:1994, “ Exactitud (veracidad y precisión) de los métodos y resultados de medición – Parte 2: Método básico para la determinación de la repetibilidad y reproducibilidad de un método de medición estándar”, Organización Internacional de Normalización, Ginebra, Suiza, 1994; http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=11834
  7. ^ ab R. Moore, Departamento de Matemáticas, Universidad Macquarie, Sydney, Australia, 1999: http://faculty.washington.edu/heagerty/Books/Biostatistics/TABLES/Cochran.
  8. ^ abcde RUE 't Lam, Análisis de los resultados de la varianza en busca de valores atípicos: prueba de Cochran optimizada, Analytica Chimica Acta 659, 68–84 (2010); doi :10.1016/j.aca.2009.11.032
  9. ^ ab RUE 't Lam, Prueba de varianza de valores atípicos, blog: http://rtlam.blogspot.com/
  10. ^ Tabla de valores críticos de la distribución F: NIST

Enlaces externos