Valor p de media armónica

El valor p de media armónica ^[1]^[2]^[3] (HMP) es una técnica estadística para abordar el problema de comparaciones múltiples que controla la tasa de error de sentido fuerte por familia ^[2] (esta afirmación ha sido cuestionada ^[4] ). Mejora la potencia de la corrección de Bonferroni al realizar pruebas combinadas, es decir, al probar si los grupos de valores p son estadísticamente significativos, como el método de Fisher . ^[5] Sin embargo, evita la suposición restrictiva de que los valores p son independientes , a diferencia del método de Fisher. ^[2]^[3] En consecuencia, controla la tasa de falsos positivos cuando las pruebas son dependientes, a expensas de una menor potencia (es decir, una mayor tasa de falsos negativos ) cuando las pruebas son independientes. ^[2] Además de proporcionar una alternativa a enfoques como la corrección de Bonferroni que controla la tasa de error estricta por familia , también proporciona una alternativa al procedimiento Benjamini-Hochberg (BH) ampliamente utilizado para controlar la tasa de falsos descubrimientos menos estricta . ^[6] Esto se debe a que el poder del HMP para detectar grupos significativos de hipótesis es mayor que el poder del BH para detectar hipótesis individuales significativas . ^[2]

Existen dos versiones de la técnica: (i) interpretación directa del HMP como un valor p aproximado y (ii) un procedimiento para transformar el HMP en un valor p asintóticamente exacto. El enfoque proporciona un procedimiento de prueba multinivel en el que se pueden buscar los grupos más pequeños de valores p que sean estadísticamente significativos.

Interpretación directa de la media armónicapag-valor

La media armónica ponderada de los valores p se define como donde son ponderaciones que deben sumar uno, es decir . Se pueden elegir ponderaciones iguales, en cuyo caso . ${\textstyle p_{1},\dots,p_{L}}$ ${\overset {\circ }{p}}={\frac {\sum _{i=1}^{L}w_{i}}{\sum _{i=1}^{L}w_ {i}/p_{i}}},$ ${\textstyle w_{1},\dots,w_{L}}$ ${\textstyle \sum _ {i=1}^{L}w_ {i}=1}$ ${\textstyle w_{i}=1/L}$

En general, interpretar el HMP directamente como un valor p es anticonservador, lo que significa que la tasa de falsos positivos es mayor que la esperada. Sin embargo, a medida que el HMP se hace más pequeño, bajo ciertos supuestos, la discrepancia disminuye, de modo que la interpretación directa de la significancia logra una tasa de falsos positivos cercana a la implícita para valores suficientemente pequeños (por ejemplo, ). ^[2] ${\overset {\circ }{p}}<0.05$

El HMP nunca es anticonservador por más de un factor de para valores pequeños o para valores grandes . ^{[3] Sin embargo, estos límites representan los peores escenarios posibles bajo una dependencia arbitraria que probablemente sean conservadores en la práctica. En lugar de aplicar estos límites, se pueden producir valores}p asintóticamente exactos transformando el HMP. ${\textstyle e\,\log L}$ ${\textstyle L}$ ${\textstyle \log L}$ ${\textstyle L}$

Media armónica asintóticamente exactapag-Procedimiento de valor

El teorema del límite central generalizado muestra que un valor p asintóticamente exacto, , se puede calcular a partir del HMP, , utilizando la fórmula ^[2] Sujeto a los supuestos del teorema del límite central generalizado , este valor p transformado se vuelve exacto a medida que el número de pruebas, , se hace grande. El cálculo utiliza la distribución de Landau , cuya función de densidad se puede escribir La prueba se implementa mediante el comando del paquete R; hay un tutorial disponible en línea. ${\textstyle p_{\overset {\circ }{p}}}$ ${\overset {\circ }{p}}$ $p_{\overset {\circ }{p}}=\int _{1/{\overset {\circ }{p}}}^{\infty }f_{\textrm {Landau}}\left( x\,|\,\log L+0.874,{\frac {\pi }{2}}\right)\mathrm {d} x.$ ${\textstyle L}$ $f_{\textrm {Landau}}(x\,|\,\mu ,\sigma )={\frac {1}{\pi \sigma }}\int _{0}^{\infty }{\textrm {e}}^{-t{\frac {(x-\mu )}{\sigma }}-{\frac {2}{\pi }}t\log t}\,\sin(2t)\,{\textrm {d}}t.$ p.hmpharmonicmeanp

De manera equivalente, se puede comparar el HMP con una tabla de valores críticos (Tabla 1). La tabla ilustra que cuanto menor sea la tasa de falsos positivos y cuanto menor sea el número de pruebas, más cercano estará el valor crítico a la tasa de falsos positivos.

Pruebas múltiples mediante el procedimiento de prueba multinivel

Si el HMP es significativo en algún nivel para un grupo de valores p , se pueden buscar todos los subconjuntos de los valores p para el grupo significativo más pequeño, mientras se mantiene la tasa de error de sentido fuerte por familia. ^[2] Formalmente, esto constituye un procedimiento de prueba cerrada . ^[7] ${\textstyle \alpha}$ ${\textstyle L}$ ${\textstyle L}$

Cuando es pequeño (por ejemplo, ), la siguiente prueba multinivel basada en la interpretación directa del HMP controla la tasa de error de sentido fuerte por familia en el nivel aproximadamente ${\textstyle \alpha}$ ${\textstyle \alpha <0,05}$ ${\textstyle \alpha :}$

Defina el HMP de cualquier subconjunto de los valores p como ${\textstyle {\mathcal {R}}}$ ${\textstyle L}$ ${\overset {\circ }{p}}_{\mathcal {R}}={\frac {\sum _ {i\in {\mathcal {R}}}w_{i}}{\sum _{i\in {\mathcal {R}}}w_{i}/p_{i}}}.$
Rechace la hipótesis nula de que ninguno de los valores p del subconjunto es significativo si , donde . (Recuerde que, por definición, .) ${\textstyle {\mathcal {R}}}$ ${\textstyle {\overset {\circ }{p}}_{\mathcal {R}}\leq \alpha \,w_{\mathcal {R}}}$ ${\textstyle w_{\mathcal {R}}=\sum _{i\in {\mathcal {R}}}w_{i}}$ ${\textstyle \sum _ {i=1}^{L}w_ {i}=1}$

Una versión asintóticamente exacta de lo anterior reemplaza en el paso 2 con donde da el número de valores p , no solo los del subconjunto . ^[8] ${\textstyle {\overset {\circ }{p}}_{\mathcal {R}}}$ $p_{{\overset {\circ }{p}}_{\mathcal {R}}}=\max \left\{{\overset {\circ }{p}}_{\mathcal {R} },w_{\mathcal {R}}\int _{w_{\mathcal {R}}/{\overset {\circ }{p}}_{\mathcal {R}}}^{\infty }f_{ \textrm {Landau}}\left(x\,|\,\log L+0.874,{\frac {\pi }{2}}\right)\mathrm {d} x\right\},$ ${\textstyle L}$ ${\textstyle {\mathcal {R}}}$

Dado que la interpretación directa del HMP es más rápida, se puede utilizar un procedimiento de dos pasos para identificar subconjuntos de valores p que probablemente sean significativos mediante la interpretación directa, sujeto a confirmación mediante la fórmula asintóticamente exacta.

Propiedades del HMP

El HMP tiene una serie de propiedades que surgen del teorema del límite central generalizado. ^[2] Es:

Robusto a la dependencia positiva entre los valores p .
Insensible al número exacto de pruebas, L .
Robusto a la distribución de pesos, w .
Más influenciado por los valores p más pequeños .

Cuando el HMP no es significativo, tampoco lo es ningún subconjunto de las pruebas constituyentes. Por el contrario, cuando la prueba multinivel considera que un subconjunto de valores p es significativo, es probable que el HMP para todos los valores p combinados sea significativo; esto es seguro cuando el HMP se interpreta directamente. Cuando el objetivo es evaluar la significación de valores p individuales , de modo que las pruebas combinadas relativas a grupos de valores p no son de interés, el HMP es equivalente al procedimiento de Bonferroni, pero sujeto al umbral de significación más estricto (Tabla 1). ${\textstyle \alpha _ {L}<\alpha }$

El HMP supone que los valores p individuales tienen distribuciones uniformes estándar (no necesariamente independientes) cuando sus hipótesis nulas son verdaderas. Por lo tanto, un gran número de pruebas con poca potencia pueden perjudicar la potencia del HMP.

Si bien la elección de los pesos no es importante para la validez del HMP bajo la hipótesis nula, los pesos influyen en la potencia del procedimiento. Los métodos complementarios §5C de ^[2] y un tutorial en línea analizan la cuestión con más detalle.

Interpretaciones bayesianas del HMP

El HMP fue concebido por analogía con el promedio del modelo bayesiano y puede interpretarse como inversamente proporcional a un factor de Bayes promediado por el modelo al combinar valores p de pruebas de razón de verosimilitud . ^[1]^[2]

La regla empírica de la media armónica

IJ Good informó una relación empírica entre el factor de Bayes y el valor p de una prueba de razón de verosimilitud. ^[1] Para una hipótesis nula anidada en una hipótesis alternativa más general, observó que a menudo, donde denota el factor de Bayes a favor de versus Extrapolando, propuso una regla empírica en la que el HMP se toma como inversamente proporcional al factor de Bayes promediado por el modelo para una colección de pruebas con hipótesis nulas comunes: Para Good, su regla empírica respaldó una intercambiabilidad entre los enfoques bayesianos y clásicos para las pruebas de hipótesis. ^[9]^[10]^[11]^[12]^[13] ${\textstyle H_{0}}$ ${\textstyle H_{A},}$ ${\textrm {BF}}_{i}\approx {\frac {1}{\gamma \,p_{i}}},\quad 3{\frac {1}{3}}<\gamma <30,$ ${\textstyle {\textrm {BF}}_{i}}$ ${\textstyle H_{A}}$ $H_{0}.$ ${\textstyle L}$ ${\overline {\textrm {BF}}}=\sum _{i=1}^{L}w_{i}\,{\textrm {BF}}_{i}\approx \sum _{ i=1}^{L}{\frac {w_{i}}{\gamma \,p_{i}}}={\frac {1}{\gamma \,{\overset {\circ }{p} }}}.$

Calibración bayesiana depag-valores

Si las distribuciones de los valores p bajo las hipótesis alternativas siguen distribuciones Beta con parámetros , una forma considerada por Sellke, Bayarri y Berger, ^[14] entonces la proporcionalidad inversa entre el factor de Bayes promediado por el modelo y el HMP se puede formalizar como ^[2]^[15] donde $\left(0<\xi _{i}<1,1\right)$ ${\overline {\textrm {BF}}}=\sum _{i=1}^{L}\mu _{i}\,{\textrm {BF}}_{i}=\sum _{i=1}^{L}\mu _{i}\,\xi _{i}\,p_{i}^{\xi _{i}-1}\approx {\bar {\xi }}\sum _{i=1}^{L}w_{i}\,p_{i}^{-1}={\frac {\bar {\xi }}{\overset {\circ }{p}}},$

${\textstyle \mu _{i}}$ es la probabilidad previa de la hipótesis alternativa tal que ${\textstyle i,}$ ${\textstyle \sum _{i=1}^{L}\mu _{i}=1,}$
${\textstyle \xi _{i}/(1+\xi _{i})}$ es el valor esperado de bajo la hipótesis alternativa ${\textstyle p_{i}}$ ${\textstyle i,}$
${\textstyle w_{i}=u_{i}/{\bar {\xi }}}$ es el peso atribuido al valor p ${\textstyle i,}$
${\textstyle u_{i}=\left(\mu _{i}\,\xi _{i}\right)^{1/(1-\xi _{i})}}$ incorpora las probabilidades y potencias del modelo anterior en los pesos, y
${\textstyle {\bar {\xi }}=\sum _{i=1}^{L}u_{i}}$ normaliza los pesos.

La aproximación funciona mejor para pruebas bien potenciadas ( ). $\xi _{i}\ll 1$

La media armónicapag-valor como límite del factor de Bayes

Para pruebas de razón de verosimilitud con exactamente dos grados de libertad, el teorema de Wilks implica que , donde es la razón de verosimilitud maximizada a favor de la hipótesis alternativa y, por lo tanto , , donde es la razón de verosimilitud maximizada media ponderada, utilizando ponderaciones Dado que es un límite superior en el factor de Bayes, , entonces es un límite superior en el factor de Bayes promediado por el modelo: Si bien la equivalencia se mantiene solo para dos grados de libertad, la relación entre y y, por lo tanto, se comporta de manera similar para otros grados de libertad. ^[2] ${\textstyle p_{i}=1/R_{i}}$ ${\textstyle R_{i}}$ ${\textstyle i,}$ ${\textstyle {\overset {\circ }{p}}=1/{\bar {R}}}$ ${\textstyle {\bar {R}}}$ ${\textstyle w_{1},\dots ,w_{L}.}$ ${\textstyle R_{i}}$ ${\textstyle {\textrm {BF}}_{i}}$ ${\textstyle 1/{\overset {\circ }{p}}}$ ${\overline {\textrm {BF}}}\leq {\frac {1}{\overset {\circ }{p}}}.$ ${\textstyle {\overset {\circ }{p}}}$ ${\textstyle {\bar {R}},}$ ${\textstyle {\overline {\textrm {BF}}},}$

Suponiendo que las distribuciones de los valores p bajo las hipótesis alternativas siguen distribuciones Beta con parámetros y que los pesos del HMP proporcionan un límite superior más estricto en el factor de Bayes promediado por el modelo: un resultado que nuevamente reproduce la proporcionalidad inversa de la relación empírica de Good. ^[16] $\left(1,\kappa _{i}>1\right),$ $w_{i}=\mu _{i},$ ${\overline {\textrm {BF}}}\leq {\frac {1}{e\,{\overset {\circ }{p}}}},$

Referencias

^ abc Good, IJ (1958). "Pruebas de significancia en paralelo y en serie". Revista de la Asociación Estadounidense de Estadística . 53 (284): 799–813. doi :10.1080/01621459.1958.10501480. JSTOR 2281953.
^ abcdefghijklmn Wilson, DJ (2019). "El valor p de la media armónica para combinar pruebas dependientes". Actas de la Academia Nacional de Ciencias de Estados Unidos . 116 (4): 1195–1200. doi : 10.1073/pnas.1814092116 . PMC 6347718. PMID 30610179 .
^ abc Vovk, Vladimir ; Wang, Ruodu (25 de abril de 2019). "Combinación de valores p mediante promedios" (PDF) . Aprendizaje algorítmico en un mundo aleatorio .
^ Goeman, Jelle J.; Rosenblatt, Jonathan D.; Nichols, Thomas E. (19 de noviembre de 2019). "El valor p de la media armónica: control fuerte versus control débil y el supuesto de independencia". Actas de la Academia Nacional de Ciencias . 116 (47): 23382–23383. doi : 10.1073/pnas.1909339116 . ISSN 0027-8424. PMC 6876242 . PMID 31662466.
^ Fisher, RA (1934). Métodos estadísticos para investigadores (5.ª ed.). Edimburgo, Reino Unido: Oliver y Boyd.
^ Benjamini Y, Hochberg Y (1995). "Control de la tasa de descubrimientos falsos: un enfoque práctico y eficaz para las pruebas múltiples". Revista de la Royal Statistical Society. Serie B (Metodológica) . 57 (1): 289–300. doi :10.1111/j.2517-6161.1995.tb02031.x. JSTOR 2346101.
^ Marcus R, Eric P, Gabriel KR (1976). "Sobre procedimientos de prueba cerrados con especial referencia al análisis ordenado de varianza". Biometrika . 63 (3): 655–660. doi :10.1093/biomet/63.3.655. JSTOR 2335748.
^ Wilson, Daniel J (17 de agosto de 2019). "Corrección actualizada de "El valor p de la media armónica para combinar pruebas independientes"" (PDF) .
^ Good, IJ (1984). "C192. Una cola versus dos colas, y la regla general de la media armónica". Journal of Statistical Computation and Simulation . 19 (2): 174–176. doi :10.1080/00949658408810727.
^ Good, IJ (1984). "C193. Comparaciones pareadas versus no pareadas y la regla general de la media armónica". Revista de computación estadística y simulación . 19 (2): 176–177. doi :10.1080/00949658408810728.
^ Good, IJ (1984). "C213. Una agudización de la regla empírica de la media armónica para combinar pruebas "en paralelo"". Revista de computación estadística y simulación . 20 (2): 173–176. doi :10.1080/00949658408810770.
^ Good, IJ (1984). "C214. La regla empírica de la media armónica: algunas clases de aplicaciones". Revista de computación estadística y simulación . 20 (2): 176–179. doi :10.1080/00949658408810771.
^ Good, Irving John. (2009). Buen pensamiento: los fundamentos de la probabilidad y sus aplicaciones . Publicaciones Dover. ISBN 9780486474380.OCLC 319491702 .
^ Sellke, Thomas; Bayarri, M. J; Berger, James O (2001). "Calibración de valores p para probar hipótesis nulas precisas". The American Statistician . 55 (1): 62–71. doi :10.1198/000313001300339950. ISSN 0003-1305. S2CID 396772.
^ Wilson, DJ (2019). "Respuesta a Held: ¿Cuándo un valor p de media armónica es un factor de Bayes?" (PDF) . Actas de la Academia Nacional de Ciencias de Estados Unidos . 116 (13): 5857–5858. doi : 10.1073/pnas.1902157116 . PMC 6442550 . PMID 30890643.
^ Held, L (2019). "Sobre la interpretación bayesiana del valor p de la media armónica". Actas de la Academia Nacional de Ciencias de Estados Unidos . 116 (13): 5855–5856. doi : 10.1073/pnas.1900671116 . PMC 6442579. PMID 30890644 .