stringtranslate.com

Corrección de Šidák para la prueba t

Una de las aplicaciones de la prueba t de Student es probar la ubicación de una secuencia de variables aleatorias independientes e idénticamente distribuidas . Si queremos probar las ubicaciones de múltiples secuencias de tales variables, se debe aplicar la corrección de Šidák para calibrar el nivel de la prueba t de Student. Además, si queremos probar las ubicaciones de casi infinitas secuencias de variables, entonces se debe utilizar la corrección de Šidák, pero con precaución. Más específicamente, la validez de la corrección de Šidák depende de qué tan rápido llega al infinito el número de secuencias.

Introducción

Supongamos que estamos interesados ​​en m diferentes hipótesis, y nos gustaría comprobar si todas ellas son ciertas. Ahora el esquema de prueba de hipótesis se convierte en

: todas son ciertas;
: al menos uno de es falso.

Sea el nivel de esta prueba (el error tipo I), es decir, la probabilidad de que rechacemos falsamente cuando es verdadera.

Nuestro objetivo es diseñar una prueba con cierto nivel .

Supongamos que al probar cada hipótesis , el estadístico de prueba que utilizamos es .

Si estos son independientes, entonces se puede desarrollar una prueba mediante el siguiente procedimiento, conocido como corrección de Šidák.

Paso 1, probamos cada una de las m hipótesis nulas en el nivel .
Paso 2, si se rechaza alguna de estas m hipótesis nulas, rechazamos .

caso finito

Para un número finito de pruebas t, supongamos que para cada i , están distribuidas de forma independiente e idéntica, para cada j son independientes pero no necesariamente distribuidas de forma idéntica y tienen un cuarto momento finito.

Nuestro objetivo es diseñar una prueba con nivel α . Esta prueba puede basarse en el estadístico t de cada secuencia, es decir,

dónde:

Utilizando la corrección de Šidák, rechazamos si alguna de las pruebas t basadas en los estadísticos t anteriores rechaza al nivel. Más específicamente, rechazamos cuando

dónde

La prueba definida anteriormente tiene un nivel asintótico α , porque

caso infinito

En algunos casos, el número de secuencias aumenta a medida que aumenta el tamaño de los datos de cada secuencia. En particular, supongamos . Si esto es cierto, entonces necesitaremos probar un nulo que incluya infinitas hipótesis, es decir

Para diseñar una prueba, se puede aplicar la corrección de Šidák , como en el caso de un número finito de pruebas t. Sin embargo, cuando , la corrección de Šidák para la prueba t puede no alcanzar el nivel que queremos, es decir, es posible que el nivel verdadero de la prueba no converja al nivel nominal cuando n tiende a infinito. Este resultado está relacionado con estadísticas de alta dimensión y lo demuestran Fan, Hall y Yao (2007). [1] Específicamente, si queremos que el nivel real de la prueba converja al nivel nominal , entonces necesitamos una restricción sobre la velocidad . En efecto,

Los resultados anteriores se basan en el teorema del límite central . Según el teorema del límite central, cada uno de nuestros estadísticos t posee una distribución normal estándar asintótica, por lo que la diferencia entre la distribución de cada uno y la distribución normal estándar es asintóticamente insignificante. La pregunta es, si agregamos todas las diferencias entre la distribución de cada una y la distribución normal estándar, ¿esta agregación de diferencias sigue siendo asintóticamente ignorable?

Cuando tenemos un número finito , la respuesta es sí. Pero cuando tenemos infinitos , la respuesta en algún momento es no. Esto se debe a que en el último caso estamos sumando infinitos términos infinitesimales. Si el número de términos llega al infinito demasiado rápido, es decir, demasiado rápido, entonces la suma puede no ser cero, la distribución del estadístico t no puede aproximarse mediante la distribución normal estándar, el nivel verdadero no converge a el nivel nominal y luego falla la corrección de Šidák.

Ver también

Referencias

  1. ^ Fanático, Jianqing; Salón, Pedro; Yao, Qiwei (2007). "A cuántas pruebas de hipótesis simultáneas se puede aplicar la calibración normal, t de Student o Bootstrap". Revista de la Asociación Estadounidense de Estadística . 102 (480): 1282-1288. arXiv : matemáticas/0701003 . doi :10.1198/016214507000000969. S2CID  8622675.