Falsos positivos y falsos negativos

Un falso positivo es un error en la clasificación binaria en el que el resultado de una prueba indica incorrectamente la presencia de una condición (como una enfermedad cuando la enfermedad no está presente), mientras que un falso negativo es el error opuesto, donde el resultado de la prueba indica incorrectamente la ausencia de una condición cuando en realidad está presente. Estos son los dos tipos de errores en una prueba binaria , en contraste con los dos tipos de resultado correcto (unverdadero positivo y unverdadero negativo ). También se les conoce en medicina comodiagnósticofalso positivo(ofalso negativo), y enclasificación estadísticacomoerrorfalso positivo(ofalso negativo). ^[1]

En las pruebas de hipótesis estadísticas , los conceptos análogos se conocen como errores tipo I y tipo II , donde un resultado positivo corresponde a rechazar la hipótesis nula , y un resultado negativo corresponde a no rechazar la hipótesis nula. Los términos se usan a menudo indistintamente, pero existen diferencias en los detalles y la interpretación debido a las diferencias entre las pruebas médicas y las pruebas de hipótesis estadísticas.

error falso positivo

Un error falso positivo , o falso positivo , es un resultado que indica que existe una condición determinada cuando no es así. Por ejemplo, una prueba de embarazo que indica que una mujer está embarazada cuando no lo está, o la condena de una persona inocente.

Un error de falso positivo es un error de tipo I en el que la prueba verifica una sola condición y da una decisión afirmativa (positiva) erróneamente. Sin embargo, es importante distinguir entre la tasa de error tipo 1 y la probabilidad de que un resultado positivo sea falso. Este último se conoce como riesgo de falsos positivos (consulte Ambigüedad en la definición de tasa de falsos positivos, a continuación). ^[2]

error falso negativo

Un error de falso negativo , o falso negativo , es un resultado de prueba que indica erróneamente que una condición no se cumple. Por ejemplo, cuando una prueba de embarazo indica que una mujer no está embarazada, pero sí lo está, o cuando una persona culpable de un delito es absuelta, se trata de falsos negativos. La condición "la mujer está embarazada", o "la persona es culpable" se cumple, pero la prueba (la prueba de embarazo o el juicio ante un tribunal) no cumple con esta condición, y decide erróneamente que la persona no está embarazada o no culpable.

Un error de falso negativo es un error de tipo II que ocurre en una prueba en la que se verifica una sola condición y el resultado de la prueba es erróneo, es decir, que la condición está ausente. ^[3]

Términos relacionados

Tasas de falsos positivos y falsos negativos

La tasa de falsos positivos (FPR) es la proporción de todos los resultados negativos que aún arrojan resultados positivos en la prueba, es decir, la probabilidad condicional de un resultado positivo en la prueba dado un evento que no estuvo presente.

La tasa de falsos positivos es igual al nivel de significancia . La especificidad de la prueba es igual a 1 menos la tasa de falsos positivos.

En la prueba de hipótesis estadística , a esta fracción se le da la letra griega α , y 1 − α se define como la especificidad de la prueba. Aumentar la especificidad de la prueba reduce la probabilidad de errores de tipo I, pero puede aumentar la probabilidad de errores de tipo II (falsos negativos que rechazan la hipótesis alternativa cuando es verdadera). ^[a]

Complementariamente, elLa tasa de falsos negativos (FNR) es la proporción de positivos que arrojan resultados negativos con la prueba, es decir, la probabilidad condicional de un resultado negativo de la prueba dado que la condición que se busca está presente.

En las pruebas de hipótesis estadísticas , a esta fracción se le da la letra β . La " potencia " (o la " sensibilidad ") de la prueba es igual a 1 − β .

Ambigüedad en la definición de tasa de falsos positivos

^{Colquhoun (2014) [4]} utilizó el término tasa de descubrimiento falso (FDR) para referirse a la probabilidad de que un resultado "significativo" fuera un falso positivo. Posteriormente, Colquhoun (2017) ^[2] utilizó el término riesgo de falso positivo (FPR) para la misma cantidad, para evitar confusión con el término FDR utilizado por las personas que trabajan en comparaciones múltiples . Las correcciones para comparaciones múltiples apuntan únicamente a corregir la tasa de error tipo I, por lo que el resultado es un valor p (corregido) . Por tanto, son susceptibles a la misma mala interpretación que cualquier otro valor p . El riesgo de falso positivo siempre es mayor, a menudo mucho mayor, que el valor p . ^[4]^[2]

La confusión de estas dos ideas, el error del condicional transpuesto , ha causado muchos males. ^[5] Debido a la ambigüedad de la notación en este campo, es esencial observar la definición en cada artículo. Los peligros de confiar en los valores p se enfatizaron en Colquhoun (2017) ^[2] al señalar que incluso una observación de p = 0,001 no era necesariamente una evidencia sólida contra la hipótesis nula. A pesar de que la razón de verosimilitud a favor de la hipótesis alternativa sobre la nula es cercana a 100, si la hipótesis fuera inverosímil, con una probabilidad previa de un efecto real de 0,1, incluso la observación de p = 0,001 tendría un falso positivo. tasa del 8 por ciento. Ni siquiera alcanzaría el nivel del 5 por ciento. Como consecuencia, se ha recomendado ^[2]^[6] que cada valor p debe ir acompañado de la probabilidad previa de que exista un efecto real que sería necesario asumir para lograr un riesgo de falso positivo del 5%. . Por ejemplo, si observamos p = 0,05 en un solo experimento, tendríamos que estar 87% seguros de que hubo un efecto real antes de realizar el experimento para lograr un riesgo de falso positivo del 5%.

Característica Operativa del Receptor

El artículo " Características operativas del receptor " analiza los parámetros del procesamiento estadístico de señales basándose en proporciones de errores de varios tipos.

Ver también

Notas

^ Al desarrollar algoritmos o pruebas de detección, se debe elegir un equilibrio entre los riesgos de falsos negativos y falsos positivos. Por lo general, existe un umbral de qué tan cerca se debe alcanzar una coincidencia con una muestra determinada antes de que el algoritmo informe de una coincidencia. Cuanto mayor sea este umbral, más falsos negativos y menos falsos positivos.

Referencias

^ Falsos positivos y falsos negativos
^ abcde Colquhoun, David (2017). "La reproducibilidad de la investigación y la mala interpretación de los valores p". Ciencia abierta de la Royal Society . 4 (12): 171085. doi :10.1098/rsos.171085. PMC 5750014 . PMID 29308247.
^ Banerjee, A; Chitnis, UB; Jadhav, SL; Bhawalkar, JS; Chaudhury, S (2009). "Prueba de hipótesis, errores tipo I y tipo II". Ind Psiquiatría J. 18 (2): 127–31. doi : 10.4103/0972-6748.62274 . PMC 2996198 . PMID 21180491.
^ ab Colquhoun, David (2014). "Una investigación de la tasa de descubrimientos falsos y la mala interpretación de los valores p". Ciencia abierta de la Royal Society . 1 (3): 140216. arXiv : 1407.5296 . Código Bib : 2014RSOS....140216C. doi :10.1098/rsos.140216. PMC 4448847 . PMID 26064558.
^ Colquhoun, David. "El problema de los valores p". Eón . Revista Aeon . Consultado el 11 de diciembre de 2016 .
^ Colquhoun, David (2018). "El riesgo de falso positivo: una propuesta sobre qué hacer con los valores p". El estadístico estadounidense . 73 : 192-201. arXiv : 1802.04888 . doi :10.1080/00031305.2018.1529622. S2CID 85530643.