Tasa de cobertura falsa

En estadística , una tasa de cobertura falsa (FCR) es la tasa promedio de cobertura falsa , es decir, que no cubre los parámetros verdaderos, entre los intervalos seleccionados.

El FCR da una cobertura simultánea a un nivel (1 − α )×100% para todos los parámetros considerados en el problema. El FCR tiene una fuerte conexión con la tasa de descubrimiento falso (FDR). Ambos métodos abordan el problema de las comparaciones múltiples , FCR desde el punto de vista de los intervalos de confianza (IC) y FDR desde el punto de vista del valor P.

La FCR era necesaria debido a los peligros causados por la inferencia selectiva. Los investigadores y científicos tienden a informar o resaltar solo la parte de los datos que se consideran significativos sin indicar claramente las diversas hipótesis que se consideraron. Por tanto, es necesario comprender cómo se ocultan falsamente los datos. Hay muchos procedimientos de FCR que se pueden utilizar dependiendo de la duración del IC: IC seleccionados por Bonferroni, ajustados por Bonferroni, ^{[ cita necesaria ]} IC seleccionados por BH ajustados (Benjamini y Yekutieli 2005 ^[1] ). El incentivo de elegir un procedimiento sobre otro es asegurar que el IC sea lo más estrecho posible y mantener el FCR. Para los experimentos de microarrays y otras aplicaciones modernas, existe una gran cantidad de parámetros , a menudo decenas de miles o más, y es muy importante elegir el procedimiento más potente.

El FCR fue introducido por primera vez por Daniel Yekutieli en su tesis doctoral en 2001. ^[2]

Definiciones

No mantener el FCR significa cuando , donde es el número de hipótesis nulas verdaderas, es el número de hipótesis rechazadas, es el número de falsos positivos y es el nivel de significancia. Los intervalos con probabilidad de cobertura simultánea pueden controlar que el FCR esté delimitado por . ${\text{FCR}}>q$ $q={\frac {V}{R}}={\frac {\alpha m_{0}}{R}}$ ${\ Displaystyle m_ {0}}$ $R$ $V$ $\alpha$ $1-q$ $q$

Clasificación de pruebas de hipótesis múltiples.

La siguiente tabla define los posibles resultados al probar múltiples hipótesis nulas. Supongamos que tenemos un número m de hipótesis nulas, denotadas por: $H 1, H 2, ..., H m .$ Utilizando una prueba estadística , rechazamos la hipótesis nula si la prueba se declara significativa. No rechazamos la hipótesis nula si la prueba no es significativa. La suma de cada tipo de resultado sobre todo H _i produce las siguientes variables aleatorias:

$m$ es el número total de hipótesis probadas
${\ Displaystyle m_ {0}}$ es el número de hipótesis nulas verdaderas , un parámetro desconocido
${\ Displaystyle mm_ {0}}$ es el número de hipótesis alternativas verdaderas
$V$ es el número de falsos positivos (error tipo I) (también llamados "falsos descubrimientos")
$S$ es el número de verdaderos positivos (también llamados "verdaderos descubrimientos")
$T$ es el número de falsos negativos (error tipo II)
$U$ es el número de verdaderos negativos.
$R=V+S$ es el número de hipótesis nulas rechazadas (también llamadas "descubrimientos", ya sean verdaderas o falsas)

En $m$ pruebas de hipótesis de las cuales son hipótesis nulas verdaderas, $R$ es una variable aleatoria observable y $S$ , $T$ , $U$ y $V$ son variables aleatorias no observables . ${\ Displaystyle m_ {0}}$

Los problemas que aborda el FCR

Selección

La selección causa una cobertura promedio reducida. La selección puede presentarse como una condición para un evento definido por los datos y puede afectar la probabilidad de cobertura de un IC para un solo parámetro . De manera equivalente, el problema de la selección cambia el sentido básico de los valores P. Los procedimientos FCR consideran que el objetivo de una cobertura condicional siguiendo cualquier regla de selección para cualquier conjunto de valores (desconocidos) de los parámetros es imposible de lograr. Es posible una propiedad más débil cuando se trata de CI selectivos y evitará declaraciones de cobertura falsas. FCR es una medida de cobertura de intervalo después de la selección. Por lo tanto, aunque un IC 1 − α no ofrece cobertura selectiva ( condicional ), la probabilidad de construir un IC sin cobertura es como máximo α , donde

\Pr[\theta \not \in \mathrm {CI} ,\ {\text{CI construido}}]\leq \Pr[\theta \not \in \mathrm {CI} ]\leq \alpha

Selección y multiplicidad

Cuando se enfrenta tanto a la multiplicidad (inferencia sobre múltiples parámetros) como a la selección , no sólo la proporción esperada de cobertura sobre los parámetros seleccionados en 1−α no es equivalente a la proporción esperada de no cobertura en α, sino que además esta última ya no puede garantizarse mediante construir CI marginales para cada parámetro seleccionado. Los procedimientos FCR resuelven esto tomando la proporción esperada de parámetros no cubiertos por sus CI entre los parámetros seleccionados, donde la proporción es 0 si no se selecciona ningún parámetro. Esta tasa de declaración de cobertura falsa (FCR) es una propiedad de cualquier procedimiento que se define por la forma en que se seleccionan los parámetros y la forma en que se construyen los múltiples intervalos.

Procedimientos de control

Procedimiento de Bonferroni (seleccionado por Bonferroni-ajustado por Bonferroni) para IC simultánea

IC simultáneos con procedimiento de Bonferroni cuando tenemos m parámetros, cada IC marginal construido en el nivel 1 − α/m. Sin selección, estos CI ofrecen cobertura simultánea, en el sentido de que la probabilidad de que todos los CI cubran sus respectivos parámetros es al menos 1 − α. desafortunadamente, incluso una propiedad tan fuerte no garantiza la propiedad de confianza condicional después de la selección.

FCR para IC simultáneo seleccionado por Bonferroni y ajustado por Bonferroni

El procedimiento Bonferroni-Bonferroni no puede ofrecer cobertura condicional, sin embargo, controla el FCR en <α. De hecho, lo hace demasiado bien, en el sentido de que el FCR está demasiado cerca de 0 para valores grandes de θ. La selección de intervalos se basa en las pruebas de Bonferroni y luego se construyen los IC de Bonferroni. El FCR se estima calculando la proporción de intervalos que no cubren sus respectivos parámetros entre los IC construidos (estableciendo la proporción en 0 cuando no se selecciona ninguno). Donde la selección se basa en pruebas individuales no ajustadas y se construyen IC no ajustados.

IC seleccionados por BH ajustados por FCR

En el procedimiento BH para FDR después de ordenar los valores de p P (1) ≤ • • • ≤ P ( m ) y calcular R = max{ j : P ( j ) ≤ j • q / m }, las R hipótesis nulas para las cuales P ( i ) ≤ R • q / m son rechazados. Si la prueba se realiza utilizando el procedimiento de Bonferroni, entonces el límite inferior del FCR puede caer muy por debajo del nivel deseado q , lo que implica que los intervalos son demasiado largos. Por el contrario, al aplicar el siguiente procedimiento, que combina el procedimiento general con las pruebas de control FDR en el procedimiento BH, también se obtiene un límite inferior para el FCR, q /2 ≤ FCR. Este procedimiento es agudo en el sentido de que para algunas configuraciones, el FCR se aproxima a q .

1. Ordene los valores de p utilizados para probar las m hipótesis con respecto a los parámetros, P (1) ≤ • • • ≤ P ( m ).

2. Calcule R = máx{ i : P ( i ) ≤ i • q / m }.

3. Seleccione los parámetros R para los cuales P ( i ) ≤ R • q / m , correspondientes a las hipótesis rechazadas.

4. Construya un CI 1 − R • q / m para cada parámetro seleccionado.

Ver también

Referencias

Notas a pie de página

^ Benjamín, Yoav; Yekutieli, Daniel (marzo de 2005). "Tasa de descubrimiento falso: intervalos de confianza múltiples ajustados para parámetros seleccionados" (pdf) . Revista de la Asociación Estadounidense de Estadística . 100 (469): 71–93. doi :10.1198/016214504000001907.
^ Resultados teóricos necesarios para aplicar la tasa de descubrimiento falso en problemas estadísticos. Abril de 2001 (Sección 3.2, página 51)

Otras fuentes

Zhao, Zhigen; Hwang, gen JT (2012). "Tasa de cobertura falsa de Bayes empírica que controla los intervalos de confianza" (pdf) . Revista de la Royal Statistical Society, Serie B. doi :10.1111/j.1467-9868.2012.01033.x.^{[ enlace muerto permanente ]}