stringtranslate.com

Tasa de falsos positivos

En estadística , cuando se realizan comparaciones múltiples , una proporción de falsos positivos (también conocida como proporción de fallas o falsas alarmas) es la probabilidad de rechazar falsamente la hipótesis nula para una prueba en particular . La tasa de falsos positivos se calcula como la relación entre el número de eventos negativos categorizados erróneamente como positivos (falsos positivos) y el número total de eventos negativos reales (independientemente de la clasificación).

La tasa de falsos positivos (o "tasa de falsas alarmas") generalmente se refiere a la expectativa de la proporción de falsos positivos .

Definición

La tasa de falsos positivos es

donde es el número de falsos positivos, es el número de verdaderos negativos y es el número total de verdaderos negativos.

El nivel de significancia que se utiliza para probar cada hipótesis se establece en función de la forma de inferencia ( inferencia simultánea versus inferencia selectiva ) y sus criterios de respaldo (por ejemplo, FWER o FDR ), que fueron predeterminados por el investigador.

Cuando se realizan comparaciones múltiples en un marco estadístico como el anterior, la proporción de falsos positivos (también conocida como proporción de falsas alarmas , a diferencia de tasa de falsos positivos / tasa de falsas alarmas ) generalmente se refiere a la probabilidad de rechazar falsamente la hipótesis nula para un determinado prueba . Usando la terminología sugerida aquí, es simplemente .

Dado que V es una variable aleatoria y una constante ( ), la proporción de falsos positivos también es una variable aleatoria, que oscila entre 0 y 1. La tasa de falsos positivos (o "tasa de falsas alarmas") generalmente se refiere a la expectativa de la proporción de falsos positivos , expresada por .

Vale la pena señalar que las dos definiciones ("proporción de falsos positivos" / "tasa de falsos positivos") son algo intercambiables. Por ejemplo, en el artículo al que se hace referencia, [1] sirve como "tasa" de falso positivo en lugar de "proporción".

Clasificación de pruebas de hipótesis múltiples.

La siguiente tabla define los posibles resultados al probar múltiples hipótesis nulas. Supongamos que tenemos un número m de hipótesis nulas, denotadas por: H 1H 2 , ...,  H m . Utilizando una prueba estadística , rechazamos la hipótesis nula si la prueba se declara significativa. No rechazamos la hipótesis nula si la prueba no es significativa. La suma de cada tipo de resultado sobre todo H i   produce las siguientes variables aleatorias:

En m pruebas de hipótesis de las cuales son hipótesis nulas verdaderas, R es una variable aleatoria observable y S , T , U y V son variables aleatorias no observables .

Comparación con otras tasas de error

Si bien la tasa de falsos positivos es matemáticamente igual a la tasa de error tipo I , se considera un término separado por las siguientes razones: [ cita necesaria ]

Por el contrario, la tasa de falsos positivos está asociada con un resultado post-anterior , que es el número esperado de falsos positivos dividido por el número total de hipótesis bajo la combinación real de hipótesis nulas verdaderas y no verdaderas (sin tener en cuenta el "global"). hipótesis nula). Dado que la tasa de falsos positivos es un parámetro que no controla el investigador, no puede identificarse con el nivel de significancia.

La tasa de falsos positivos tampoco debe confundirse con la tasa de error familiar , que se define como . A medida que aumenta el número de pruebas, la tasa de error familiar generalmente converge a 1, mientras que la tasa de falsos positivos permanece fija.

Por último, es importante señalar la profunda diferencia entre la tasa de falsos positivos y la tasa de falsos descubrimientos : mientras que la primera se define como , la segunda se define como .

Ver también

Referencias

  1. ^ Burke, Donald; Brundage, Juan; Redfield, Robert (1988). "Medición de la tasa de falsos positivos en un programa de detección de infecciones por el virus de la inmunodeficiencia humana". El diario Nueva Inglaterra de medicina . 319 (15): 961–964. doi :10.1056/NEJM198810133191501. PMID  3419477.