Valores predictivos positivos y negativos.

Los valores predictivos positivos y negativos ( VPP y VPN respectivamente) son las proporciones de resultados positivos y negativos en estadísticas y pruebas de diagnóstico que son resultados verdaderos positivos y verdaderos negativos , respectivamente. ^[1] El VPP y el VPN describen la realización de una prueba de diagnóstico u otra medida estadística. Un resultado alto puede interpretarse como una indicación de la exactitud de dicha estadística. El VPP y el VPN no son intrínsecos a la prueba (como lo son la tasa de verdaderos positivos y la tasa de verdaderos negativos ); Dependen también de la prevalencia . ^[2] Tanto el VPP como el VPN se pueden derivar utilizando el teorema de Bayes .

Aunque a veces se utiliza como sinónimo, un valor predictivo positivo generalmente se refiere a lo establecido por los grupos de control, mientras que una probabilidad post-prueba se refiere a una probabilidad para un individuo. Aún así, si la probabilidad del individuo antes de la prueba de la condición objetivo es la misma que la prevalencia en el grupo de control utilizado para establecer el valor predictivo positivo, los dos son numéricamente iguales.

En la recuperación de información , la estadística PPV a menudo se denomina precisión .

Definición

Valor predictivo positivo (VPP)

El valor predictivo positivo (VPP), o precisión , se define como

{\text{PPV}}={\frac {\text{Number of true positives}}{{\text{Number of true positives}}+{\text{Number of false positives}}}}={\frac {\text{Number of true positives}}{\text{Number of positive calls}}}

donde un " verdadero positivo " es el evento de que la prueba haga una predicción positiva y el sujeto tenga un resultado positivo según el estándar de oro , y un " falso positivo " es el evento de que la prueba haga una predicción positiva y el sujeto tenga un resultado negativo bajo el patrón oro. El valor ideal del PPV, con una prueba perfecta, es 1 (100%), y el peor valor posible sería cero.

El VPP también se puede calcular a partir de la sensibilidad , la especificidad y la prevalencia de la afección:

{\text{PPV}}={\frac {{\text{sensitivity}}\times {\text{prevalence}}}{{\text{sensitivity}}\times {\text{prevalence}}+(1-{\text{specificity}})\times (1-{\text{prevalence}})}}

cf. Teorema de Bayes

El complemento del PPV es la tasa de descubrimiento falso (FDR):

{\text{FDR}}=1-{\text{PPV}}={\frac {\text{Number of false positives}}{{\text{Number of true positives}}+{\text{Number of false positives}}}}={\frac {\text{Number of false positives}}{\text{Number of positive calls}}}

Valor predictivo negativo (VPN)

El valor predictivo negativo se define como:

{\text{NPV}}={\frac {\text{Number of true negatives}}{{\text{Number of true negatives}}+{\text{Number of false negatives}}}}={\frac {\text{Number of true negatives}}{\text{Number of negative calls}}}

donde un " verdadero negativo " es el evento en el que la prueba hace una predicción negativa y el sujeto obtiene un resultado negativo según el estándar de oro, y un " falso negativo " es el evento en el que la prueba hace una predicción negativa y el sujeto tiene un resultado positivo bajo el patrón oro. Con una prueba perfecta, aquella que no arroja falsos negativos, el valor del VPN es 1 (100%), y con una prueba que no arroja verdaderos negativos, el valor del VPN es cero.

El VPN también se puede calcular a partir de la sensibilidad , especificidad y prevalencia :

{\text{NPV}}={\frac {{\text{specificity}}\times (1-{\text{prevalence}})}{{\text{specificity}}\times (1-{\text{prevalence}})+(1-{\text{sensitivity}})\times {\text{prevalence}}}}

{\text{NPV}}={\frac {TN}{TN+FN}}

El complemento del VPN es eltasa de omisión falsa (PARA):

{\text{FOR}}=1-{\text{NPV}}={\frac {\text{Number of false negatives}}{{\text{Number of true negatives}}+{\text{Number of false negatives}}}}={\frac {\text{Number of false negatives}}{\text{Number of negative calls}}}

Aunque a veces se utiliza como sinónimo, un valor predictivo negativo generalmente se refiere a lo establecido por los grupos de control, mientras que una probabilidad post-prueba negativa se refiere más bien a una probabilidad para un individuo. Aún así, si la probabilidad del individuo antes de la prueba de la condición objetivo es la misma que la prevalencia en el grupo de control utilizado para establecer el valor predictivo negativo, entonces los dos son numéricamente iguales.

Relación

El siguiente diagrama ilustra cómo se relacionan el valor predictivo positivo , el valor predictivo negativo , la sensibilidad y la especificidad .

^ el número de casos positivos reales en los datos
^ Un resultado de prueba que indica correctamente la presencia de una condición o característica.
^ Error de tipo II: resultado de una prueba que indica erróneamente que una condición o atributo particular está ausente
^ el número de casos negativos reales en los datos
^ Un resultado de prueba que indica correctamente la ausencia de una condición o característica.
^ Error de tipo I: resultado de una prueba que indica erróneamente que está presente una condición o atributo particular

Tenga en cuenta que los valores predictivos positivos y negativos sólo pueden estimarse utilizando datos de un estudio transversal u otro estudio poblacional en el que se puedan obtener estimaciones de prevalencia válidas. Por el contrario, la sensibilidad y la especificidad pueden estimarse a partir de estudios de casos y controles .

Ejemplo resuelto

Supongamos que la prueba de detección de sangre oculta en heces (FOB) se utiliza en 2030 personas para detectar cáncer de intestino:

El pequeño valor predictivo positivo (VPP = 10%) indica que muchos de los resultados positivos de este procedimiento de prueba son falsos positivos. Por lo tanto, será necesario realizar un seguimiento de cualquier resultado positivo con una prueba más fiable para obtener una evaluación más precisa de la presencia de cáncer. Sin embargo, una prueba de este tipo puede resultar útil si es económica y conveniente. En cambio, la fortaleza de la prueba de detección FOB reside en su valor predictivo negativo, que, si es negativo para un individuo, nos da una alta confianza de que su resultado negativo es verdadero.

Problemas

Otros factores individuales

Tenga en cuenta que el VPP no es intrínseco a la prueba; depende también de la prevalencia. ^[2] Debido al gran efecto de la prevalencia sobre los valores predictivos, se ha propuesto un enfoque estandarizado, donde el VPP se normaliza a una prevalencia del 50%. ^[12] El VPP es directamente proporcional ^{[ dudoso – discutir ]} a la prevalencia de la enfermedad o afección. En el ejemplo anterior, si el grupo de personas examinadas hubiera incluido una mayor proporción de personas con cáncer de intestino, entonces el VPP probablemente sería mayor y el VPN menor. Si todos los miembros del grupo tuvieran cáncer de intestino, el VPP sería del 100 % y el VPN del 0 %. ^{[ cita necesaria ]}

Para superar este problema, el VPN y el PPV sólo deben usarse si la relación entre el número de pacientes en el grupo de enfermedad y el número de pacientes en el grupo de control sano utilizado para establecer el VPN y el PPV es equivalente a la prevalencia de las enfermedades en la población estudiada o, en caso de que se comparen dos grupos de enfermedades, si la proporción entre el número de pacientes en el grupo de enfermedades 1 y el número de pacientes en el grupo de enfermedades 2 es equivalente a la proporción de las prevalencias de las dos enfermedades estudiadas. De lo contrario, los índices de probabilidad positivos y negativos son más precisos que el VPN y el VPP, porque los índices de probabilidad no dependen de la prevalencia. ^{[ cita necesaria ]}

Cuando un individuo sometido a la prueba tiene una probabilidad previa a la prueba de tener una afección diferente a la de los grupos de control utilizados para establecer el VPP y el VPN, el VPP y el VPN generalmente se distinguen de las probabilidades posteriores a la prueba positivas y negativas , siendo el VPP y el VPN refiriéndose a las establecidas por los grupos de control, y las probabilidades post-test refiriéndose a las del individuo evaluado (según se estiman, por ejemplo, mediante índices de verosimilitud ). Preferiblemente, en tales casos, se debe estudiar un grupo grande de individuos equivalentes, con el fin de establecer valores predictivos positivos y negativos separados para el uso de la prueba en dichos individuos. ^{[ cita necesaria ]}

actualización bayesiana

El teorema de Bayes confiere limitaciones inherentes a la precisión de las pruebas de detección en función de la prevalencia de la enfermedad o la probabilidad previa a la prueba. Se ha demostrado que un sistema de pruebas puede tolerar caídas significativas en la prevalencia, hasta un cierto punto bien definido conocido como umbral de prevalencia , por debajo del cual la confiabilidad de una prueba de detección positiva cae precipitadamente. Dicho esto, Balayla et al. ^[13] demostraron que las pruebas secuenciales superan las limitaciones bayesianas antes mencionadas y, por lo tanto, mejoran la confiabilidad de las pruebas de detección. Para un valor predictivo positivo deseado que se acerque a alguna constante , el número de iteraciones de prueba positivas necesarias es: $\rho$ $k$ $n_{i}$

n_{i}=\lim _{\rho \to k}\left\lceil {\frac {\ln \left[{\frac {\rho (\phi -1)}{\phi (\rho -1)}}\right]}{\ln \left[{\frac {a}{1-b}}\right]}}\right\rceil

dónde

$\rho$ es el PPV deseado
$n_{i}$ es el número de iteraciones de prueba necesarias para lograr $\rho$
$a$ es la sensibilidad
$b$ es la especificidad
$\phi$ es la prevalencia de la enfermedad, y
$k$ es una constante.

Es de destacar que el denominador de la ecuación anterior es el logaritmo natural de la razón de verosimilitud positiva (LR+).

Diferentes condiciones objetivo

El VPP se utiliza para indicar la probabilidad de que, en caso de una prueba positiva, el paciente realmente tenga la enfermedad especificada. Sin embargo, puede haber más de una causa para una enfermedad y es posible que una sola causa potencial no siempre dé como resultado la enfermedad manifiesta que se observa en un paciente. Existe la posibilidad de mezclar condiciones objetivo relacionadas de PPV y VPN, como interpretar el PPV o VPN de una prueba como si tuviera una enfermedad, cuando ese valor de PPV o VPN en realidad se refiere solo a una predisposición a tener esa enfermedad. ^{[ cita necesaria ]}

Un ejemplo es el hisopo microbiológico de garganta que se utiliza en pacientes con dolor de garganta . Por lo general, las publicaciones que indican el VPP de un hisopo de garganta informan sobre la probabilidad de que esta bacteria esté presente en la garganta, en lugar de que el paciente esté enfermo a causa de la bacteria encontrada. Si la presencia de esta bacteria siempre provocara dolor de garganta, entonces la VPP sería muy útil. Sin embargo, las bacterias pueden colonizar a las personas de forma inofensiva y nunca provocar infecciones o enfermedades. Los dolores de garganta que ocurren en estas personas son causados por otros agentes, como un virus. En esta situación, el estándar de oro utilizado en el estudio de evaluación representa sólo la presencia de bacterias (que podrían ser inofensivas), pero no una enfermedad bacteriana causal de dolor de garganta. Se puede demostrar que este problema afectará el valor predictivo positivo mucho más que el valor predictivo negativo. ^[14] Para evaluar pruebas de diagnóstico donde el estándar de oro analiza solo las causas potenciales de la enfermedad, se puede usar una extensión del valor predictivo denominado Valor Predictivo Etiológico. ^[15]^[16]

Ver también

Referencias

^ Fletcher, Robert H. Fletcher; Susanne W. (2005). Epidemiología clínica: lo esencial (4ª ed.). Baltimore, Maryland: Lippincott Williams & Wilkins. págs.45. ISBN 0-7817-5215-9.{{cite book}}: CS1 maint: multiple names: authors list (link)
^ ab Altman, director general; Suave, JM (1994). "Pruebas de diagnóstico 2: Valores predictivos". BMJ . 309 (6947): 102. doi :10.1136/bmj.309.6947.102. PMC 2540558 . PMID 8038641.
^ Balayla, Jacques (2020). "Umbral de prevalencia (ϕe) y geometría de las curvas de detección". MÁS UNO . 15 (10): e0240215. doi : 10.1371/journal.pone.0240215 . PMID 33027310.
^ Fawcett, Tom (2006). "Una introducción al análisis de la República de China" (PDF) . Letras de reconocimiento de patrones . 27 (8): 861–874. doi :10.1016/j.patrec.2005.10.010. S2CID 2027090.
^ Piryonesi S. Madeh; El-Diraby Tamer E. (01/03/2020). "Análisis de datos en la gestión de activos: predicción rentable del índice de condición del pavimento". Revista de sistemas de infraestructura . 26 (1): 04019036. doi :10.1061/(ASCE)IS.1943-555X.0000512. S2CID 213782055.
^ Poderes, David MW (2011). "Evaluación: de la precisión, la recuperación y la medida F a la República de China, la información, el marcado y la correlación". Revista de tecnologías de aprendizaje automático . 2 (1): 37–63.
^ Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I. (eds.). Enciclopedia de aprendizaje automático . Saltador. doi :10.1007/978-0-387-30164-8. ISBN 978-0-387-30164-8.
^ Brooks, Harold; Marrón, púa; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Pablo; Stephenson, David (26 de enero de 2015). "Grupo de trabajo conjunto PMIM/WGNE sobre investigación de verificación de pronósticos". Colaboración para la investigación meteorológica y climática de Australia . Organización Meteorológica Mundial . Consultado el 17 de julio de 2019 .
^ Chicco D, Jurman G (enero de 2020). "Las ventajas del coeficiente de correlación de Matthews (MCC) sobre la puntuación F1 y la precisión en la evaluación de la clasificación binaria". Genómica BMC . 21 (1): 6-1–6-13. doi : 10.1186/s12864-019-6413-7 . PMC 6941312 . PMID 31898477.
^ Chicco D, Toetsch N, Jurman G (febrero de 2021). "El coeficiente de correlación de Matthews (MCC) es más confiable que la precisión equilibrada, la información de las casas de apuestas y la marcación en la evaluación de la matriz de confusión de dos clases". Minería de biodatos . 14 (13): 13. doi : 10.1186/s13040-021-00244-z . PMC 7863449 . PMID 33541410.
^ Tharwat A. (agosto de 2018). "Métodos de evaluación de clasificación". Computación e Informática Aplicada . 17 : 168-192. doi : 10.1016/j.aci.2018.08.003 .
^ Heston, Thomas F. (2011). "Estandarización de valores predictivos en la investigación de diagnóstico por imágenes". Revista de imágenes por resonancia magnética . 33 (2): 505, respuesta del autor 506–7. doi : 10.1002/jmri.22466 . PMID 21274995.
^ Jacques Balayla. Actualización bayesiana y pruebas secuenciales: superación de las limitaciones inferenciales de las pruebas de detección. ArXiv 2020. https://arxiv.org/abs/2006.11641.
^ Orda, Ulrich; Gunnarsson, Ronny K; Orda, Sabina; Fitzgerald, Marcos; Rofe, Geoffry; Dargan, Anna (2016). "Valor predictivo etiológico de un inmunoensayo rápido para la detección del antígeno de estreptococo del grupo A a partir de hisopos de garganta en pacientes que presentan dolor de garganta" (PDF) . Revista Internacional de Enfermedades Infecciosas . 45 (abril): 32–5. doi : 10.1016/j.ijid.2016.02.002 . PMID 26873279.
^ Gunnarsson, Ronny K.; Lanke, enero (2002). "El valor predictivo de las pruebas de diagnóstico microbiológico si hay portadores asintomáticos". Estadística en Medicina . 21 (12): 1773–85. doi :10.1002/sim.1119. PMID 12111911. S2CID 26163122.
^ Gunnarsson, Ronny K. "Calculadora EPV". Televisión de la red científica .