stringtranslate.com

Corrección de Bonferroni

En estadística , la corrección de Bonferroni es un método para contrarrestar el problema de comparaciones múltiples .

Fondo

El método recibe su nombre por el uso de las desigualdades de Bonferroni . [1] La aplicación del método a los intervalos de confianza fue descrita por Olive Jean Dunn . [2]

La prueba de hipótesis estadística se basa en rechazar la hipótesis nula cuando la probabilidad de que los datos observados sean ciertos sería baja si la hipótesis nula fuera cierta. Si se prueban múltiples hipótesis, aumenta la probabilidad de observar un evento poco frecuente y, por lo tanto, aumenta la probabilidad de rechazar incorrectamente una hipótesis nula (es decir, cometer un error de tipo I ). [3]

La corrección de Bonferroni compensa ese aumento probando cada hipótesis individual en un nivel de significancia de , donde es el nivel alfa general deseado y es el número de hipótesis. [4] Por ejemplo, si un ensayo está probando hipótesis con un nivel alfa general deseado , entonces la corrección de Bonferroni probaría cada hipótesis individual en .

La corrección de Bonferroni también se puede aplicar como un ajuste del valor p: con ese enfoque, en lugar de ajustar el nivel alfa, cada valor p se multiplica por el número de pruebas (los valores p ajustados que superan 1 se reducen a 1) y el nivel alfa no se modifica. Las decisiones de significancia con este enfoque serán las mismas que con el enfoque de ajuste del nivel alfa.

Definición

Sea una familia de hipótesis nulas y sean sus valores p correspondientes . Sea el número total de hipótesis nulas y sea el número de hipótesis nulas verdaderas (que presumiblemente es desconocido para el investigador). La tasa de error por familia (FWER) es la probabilidad de rechazar al menos una verdadera , es decir, de cometer al menos un error de tipo I . La corrección de Bonferroni rechaza la hipótesis nula para cada , controlando así la FWER en . La prueba de este control se desprende de la desigualdad de Boole , como sigue:

Este control no requiere ninguna suposición sobre la dependencia entre los valores p o sobre cuántas de las hipótesis nulas son verdaderas. [5]

Extensiones

Generalización

En lugar de probar cada hipótesis en el nivel, las hipótesis pueden probarse en cualquier otra combinación de niveles que sumen , siempre que el nivel de cada prueba se decida antes de mirar los datos. [6] Por ejemplo, para dos pruebas de hipótesis, se podría mantener un total de 0,05 realizando una prueba en 0,04 y la otra en 0,01.

Intervalos de confianza

El procedimiento propuesto por Dunn [2] se puede utilizar para ajustar los intervalos de confianza . Si se establecen intervalos de confianza y se desea tener un nivel de confianza general de , cada intervalo de confianza individual se puede ajustar al nivel de . [2]

Problemas continuos

Al buscar una señal en un espacio de parámetros continuos, también puede haber un problema de comparaciones múltiples o un efecto de búsqueda en otro lugar. Por ejemplo, un físico podría estar buscando descubrir una partícula de masa desconocida considerando un amplio rango de masas; este fue el caso durante la detección del bosón de Higgs , que ganó el Premio Nobel . En tales casos, se puede aplicar una generalización continua de la corrección de Bonferroni empleando la lógica bayesiana para relacionar el número efectivo de ensayos, , con la relación de volumen anterior a posterior. [7]

Alternativas

Existen formas alternativas de controlar la tasa de error por familia . Por ejemplo, el método de Holm–Bonferroni y la corrección de Šidák son procedimientos universalmente más potentes que la corrección de Bonferroni, lo que significa que siempre son al menos igual de potentes. Pero a diferencia del procedimiento de Bonferroni, estos métodos no controlan el número esperado de errores de tipo I por familia (la tasa de error de tipo I por familia). [8]

Crítica

Con respecto al control de FWER , la corrección de Bonferroni puede ser conservadora si hay una gran cantidad de pruebas y/o las estadísticas de prueba están correlacionadas positivamente. [9]

Las correcciones de pruebas múltiples, incluido el procedimiento de Bonferroni, aumentan la probabilidad de errores de tipo II cuando las hipótesis nulas son falsas, es decir, reducen el poder estadístico . [10] [9]

Referencias

  1. ^ Bonferroni, CE, Teoria statistica delle classi e calcolo delle probabilità, Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze 1936
  2. ^ abc Dunn, Olive Jean (1961). "Comparaciones múltiples entre medias" (PDF) . Revista de la Asociación Estadounidense de Estadística . 56 (293): 52–64. CiteSeerX  10.1.1.309.1277 . doi :10.1080/01621459.1961.10482090.
  3. ^ Mittelhammer, Ron C. ; Judge, George G. ; Miller, Douglas J. (2000). Fundamentos econométricos. Cambridge University Press. págs. 73–74. ISBN 978-0-521-62394-0.
  4. ^ Miller, Rupert G. (1966). Inferencia estadística simultánea. Springer. ISBN 9781461381228.
  5. ^ Goeman, Jelle J.; Solari, Aldo (2014). "Pruebas de hipótesis múltiples en genómica". Estadística en medicina . 33 (11): 1946–1978. doi :10.1002/sim.6082. PMID  24399688. S2CID  22086583.
  6. ^ Neuwald, AF; Green, P (1994). "Detección de patrones en secuencias de proteínas". J. Mol. Biol . 239 (5): 698–712. doi :10.1006/jmbi.1994.1407. PMID  8014990.
  7. ^ Bayer, Adrian E.; Seljak, Uroš (2020). "El efecto de mirar a otro lado desde una perspectiva bayesiana y frecuentista unificada". Revista de Cosmología y Física de Astropartículas . 2020 (10): 009. arXiv : 2007.13821 . doi :10.1088/1475-7516/2020/10/009. S2CID  220830693.
  8. ^ Frane, Andrew (2015). "¿Son relevantes las tasas de error de tipo I por familia en las ciencias sociales y del comportamiento?". Journal of Modern Applied Statistical Methods . 14 (1): 12–23. doi : 10.22237/jmasm/1430453040 .
  9. ^ ab Moran, Matthew (2003). "Argumentos para rechazar el método Bonferroni secuencial en estudios ecológicos". Oikos . 100 (2): 403–405. doi :10.1034/j.1600-0706.2003.12010.x.
  10. ^ Nakagawa, Shinichi (2004). "Adiós a Bonferroni: los problemas del bajo poder estadístico y el sesgo de publicación". Ecología del comportamiento . 15 (6): 1044–1045. doi : 10.1093/beheco/arh107 .

Enlaces externos