Estadística de prueba
En estadística , la estadística de chi-cuadrado reducida se utiliza ampliamente en las pruebas de bondad de ajuste . También se la conoce como desviación cuadrática media ponderada ( MSWD ) en la datación isotópica [1] y como varianza del peso unitario en el contexto de los mínimos cuadrados ponderados . [2] [3]
Su raíz cuadrada se llama error estándar de regresión , [4] error estándar de la regresión , [5] [6] o error estándar de la ecuación [7]
(ver Mínimos cuadrados ordinarios § Chi-cuadrado reducido )
Definición
Se define como chi-cuadrado por grado de libertad : [8] [9] [10] [11] : 85 [12] [13] [14] [15]
donde el chi-cuadrado es una suma ponderada de las desviaciones al cuadrado :
con entradas: varianza , observaciones O y datos calculados C . [8]
El grado de libertad, , es igual al número de observaciones n menos el número de parámetros ajustados m .
En los mínimos cuadrados ponderados , la definición suele escribirse en notación matricial como
donde r es el vector de residuos y W es la matriz de ponderación, la inversa de la matriz de covarianza de entrada (diagonal) de las observaciones. Si W no es diagonal, se aplican los mínimos cuadrados generalizados .
En mínimos cuadrados ordinarios , la definición se simplifica a:
donde el numerador es la suma residual de cuadrados (RSS).
Cuando el ajuste es simplemente una media ordinaria, entonces es igual a la desviación estándar de la muestra .
Discusión
Como regla general, cuando la varianza del error de medición se conoce a priori , a indica un ajuste deficiente del modelo. A indica que el ajuste no ha capturado completamente los datos (o que se ha subestimado la varianza del error). En principio, un valor de alrededor de indica que el grado de coincidencia entre las observaciones y las estimaciones está de acuerdo con la varianza del error. A indica que el modelo está " sobreajustando " los datos: o bien el modelo está ajustando incorrectamente el ruido o bien se ha sobreestimado la varianza del error. [11] : 89
Cuando la varianza del error de medición sólo se conoce parcialmente, el chi-cuadrado reducido puede servir como una corrección estimada a posteriori .
Aplicaciones
Geocronología
En geocronología , la MSWD es una medida de bondad de ajuste que tiene en cuenta la importancia relativa de la reproducibilidad interna y externa, y su uso más común es en la datación isotópica. [16] [17] [1] [18] [19] [20]
En general cuando:
MSWD = 1 si los datos de edad se ajustan a una distribución normal univariante en el espacio t (para la edad media aritmética ) o log( t ) (para la edad media geométrica ), o si los datos de composición se ajustan a una distribución normal bivariada en el espacio [log( U / He ),log( Th /He)] (para la edad central).
MSWD < 1 si la dispersión observada es menor que la predicha por las incertidumbres analíticas. En este caso, se dice que los datos están "subdispersados", lo que indica que se sobrestimaron las incertidumbres analíticas.
MSWD > 1 si la dispersión observada excede la predicha por las incertidumbres analíticas. En este caso, se dice que los datos están "sobredispersados". Esta situación es la regla más que la excepción en la geocronología (U-Th)/He, lo que indica una comprensión incompleta del sistema isotópico. Se han propuesto varias razones para explicar la sobredispersión de los datos (U-Th)/He, incluidas las distribuciones de U-Th desiguales y los daños por radiación.
A menudo, el geocronólogo determinará una serie de mediciones de edad en una sola muestra, y el valor medido tendrá una ponderación y un error asociado para cada determinación de edad. En cuanto a la ponderación, se pueden ponderar todas las edades medidas por igual o ponderarlas según la proporción de la muestra que representan. Por ejemplo, si se utilizaron dos tercios de la muestra para la primera medición y un tercio para la segunda y última, entonces se podría ponderar la primera medición dos veces más que la segunda.
La media aritmética de las determinaciones de la edad es
pero este valor puede ser engañoso, a menos que cada determinación de la edad tenga la misma importancia.
Cuando se puede suponer que cada valor medido tiene la misma ponderación o significancia, los estimadores sesgados e insesgados (o " muestra " y "población" respectivamente) de la varianza se calculan de la siguiente manera:
La desviación estándar es la raíz cuadrada de la varianza.
Cuando las determinaciones individuales de una edad no tienen la misma importancia, es mejor utilizar una media ponderada para obtener una edad "promedio", de la siguiente manera:
Se puede demostrar que el estimador ponderado sesgado de la varianza es
que se puede calcular como
El estimador ponderado imparcial de la varianza de la muestra se puede calcular de la siguiente manera:
Nuevamente, la desviación estándar correspondiente es la raíz cuadrada de la varianza.
El estimador ponderado imparcial de la varianza de la muestra también se puede calcular sobre la marcha de la siguiente manera:
El cuadrado medio no ponderado de las desviaciones ponderadas (MSWD no ponderada) se puede calcular de la siguiente manera:
Por analogía, el cuadrado medio ponderado de las desviaciones ponderadas (MSWD ponderada) se puede calcular de la siguiente manera:
Análisis de Rasch
En el análisis de datos basado en el modelo de Rasch , la estadística de chi-cuadrado reducida se denomina estadística de media cuadrática de ajuste, y la estadística de chi-cuadrado reducida ponderada por información se denomina estadística de media cuadrática infit. [21]
Referencias
- ^ ab Wendt, I., y Carl, C., 1991, La distribución estadística de la desviación ponderada cuadrática media, Chemical Geology, 275–285.
- ^ Strang, Gilbert; Borre, Kae (1997). Álgebra lineal, geodesia y GPS. Wellesley-Cambridge Press. pág. 301. ISBN 9780961408862.
- ^ Koch, Karl-Rudolf (2013). Estimación de parámetros y prueba de hipótesis en modelos lineales. Springer Berlin Heidelberg. Sección 3.2.5. ISBN 9783662039762.
- ^ Julian Faraway (2000), Regresión práctica y Anova usando R
- ^ Kenney, J.; Keeping, ES (1963). Matemáticas de la estadística . van Nostrand. pág. 187.
- ^ Zwillinger, D. (1995). Tablas y fórmulas matemáticas estándar . Chapman&Hall/CRC. pág. 626. ISBN. 0-8493-2479-3.
- ^ Hayashi, Fumio (2000). Econometría . Princeton University Press. ISBN 0-691-01018-8.
- ^ ab Laub, Charlie; Kuhl, Tonya L. (nd), ¿Qué tan malo es bueno? Una mirada crítica al ajuste de modelos de reflectividad utilizando la estadística de chi-cuadrado reducida (PDF) , University California, Davis, archivado desde el original (PDF) el 6 de octubre de 2016 , consultado el 30 de mayo de 2015
- ^ Taylor, John Robert (1997), Introducción al análisis de errores , University Science Books, pág. 268
- ^ Kirkman, TW (nd), Ajuste de curva de chi-cuadrado , consultado el 30 de mayo de 2015
- ^ ab Bevington, Philip R. (1969), Reducción de datos y análisis de errores para las ciencias físicas , Nueva York: McGraw-Hill
- ^ Mediciones y sus incertidumbres: una guía práctica para el análisis de errores moderno, por Ifan Hughes y Thomas Hase [1]
- ^ Cómo afrontar las incertidumbres: una guía para el análisis de errores, por Manfred Drosg [2]
- ^ Estadísticas prácticas para astrónomos, por JV Wall, CR Jenkins
- ^ Métodos computacionales en física e ingeniería, por Samuel Shaw Ming Wong [3]
- ^ Dickin, AP 1995. Geología de isótopos radiogénicos. Cambridge University Press, Cambridge, Reino Unido, 1995, ISBN 0-521-43151-4 , ISBN 0-521-59891-5
- ^ McDougall, I. y Harrison, TM 1988. Geocronología y termocronología por el método 40 Ar/ 39 Ar. Oxford University Press.
- ^ Lance P. Black, Sandra L. Kamo, Charlotte M. Allen, John N. Aleinikoff, Donald W. Davis, Russell J. Korsch, Chris Foudoulis 2003. TEMORA 1: un nuevo estándar de circón para la geocronología fanerozoica U-Pb. Geología química 200, 155-170.
- ^ MJ Streule, RJ Phillips, MP Searle, DJ Waters y MSA Horstwood 2009. Evolución y cronología del complejo metamórfico Pangong adyacente a la falla de Karakoram, Ladakh, modelado y geocronología U-Pb: limitaciones derivadas de la termobarometría, el modelado metamórfico y la geocronología U-Pb. Journal of the Geological Society 166, 919–932 doi :10.1144/0016-76492008-117
- ^ Roger Powell, Janet Hergt , Jon Woodhead 2002. Mejora de los cálculos isócronos con estadísticas robustas y bootstrap. Chemical Geology 185, 191–204.
- ^ Linacre, JM (2002). "¿Qué significan Infit y Outfit, Mean-square y Standardized?". Rasch Measurement Transactions . 16 (2): 878.