Valores predictivos positivos y negativos

Los valores predictivos positivos y negativos ( VPP y VPN respectivamente) son las proporciones de resultados positivos y negativos en estadísticas y pruebas diagnósticas que son resultados positivos verdaderos y negativos verdaderos , respectivamente. ^[1] El VPP y el VPN describen el rendimiento de una prueba diagnóstica u otra medida estadística. Un resultado alto puede interpretarse como un indicador de la precisión de dicha estadística. El VPP y el VPN no son intrínsecos a la prueba (como lo son la tasa de positivos verdaderos y la tasa de negativos verdaderos ); también dependen de la prevalencia . ^[2] Tanto el VPP como el VPN se pueden derivar utilizando el teorema de Bayes .

Aunque a veces se utilizan como sinónimos, un valor predictivo positivo generalmente se refiere a lo que establecen los grupos de control, mientras que una probabilidad posterior a la prueba se refiere a una probabilidad para un individuo. Aun así, si la probabilidad previa a la prueba del individuo de la condición objetivo es la misma que la prevalencia en el grupo de control utilizado para establecer el valor predictivo positivo, los dos son numéricamente iguales.

En la recuperación de información , la estadística PPV a menudo se denomina precisión .

Definición

Valor predictivo positivo (VPP)

El valor predictivo positivo (VPP), o precisión , se define como

{\text{PPV}}={\frac {\text{Number of true positives}}{{\text{Number of true positives}}+{\text{Number of false positives}}}}={\frac {\text{Number of true positives}}{\text{Number of positive calls}}}

donde un " verdadero positivo " es el evento en el que la prueba hace una predicción positiva y el sujeto tiene un resultado positivo bajo el patrón oro , y un " falso positivo " es el evento en el que la prueba hace una predicción positiva y el sujeto tiene un resultado negativo bajo el patrón oro. El valor ideal del VPP, con una prueba perfecta, es 1 (100%), y el peor valor posible sería cero.

El VPP también se puede calcular a partir de la sensibilidad , la especificidad y la prevalencia de la afección:

{\text{PPV}}={\frac {{\text{sensitivity}}\times {\text{prevalence}}}{{\text{sensitivity}}\times {\text{prevalence}}+(1-{\text{specificity}})\times (1-{\text{prevalence}})}}

Véase el teorema de Bayes.

El complemento del PPV es la tasa de falsos descubrimientos (FDR):

{\text{FDR}}=1-{\text{PPV}}={\frac {\text{Number of false positives}}{{\text{Number of true positives}}+{\text{Number of false positives}}}}={\frac {\text{Number of false positives}}{\text{Number of positive calls}}}

Valor predictivo negativo (VPN)

El valor predictivo negativo se define como:

{\text{NPV}}={\frac {\text{Number of true negatives}}{{\text{Number of true negatives}}+{\text{Number of false negatives}}}}={\frac {\text{Number of true negatives}}{\text{Number of negative calls}}}

donde un " negativo verdadero " es el evento en el que la prueba arroja una predicción negativa y el sujeto tiene un resultado negativo según el patrón oro, y un " negativo falso " es el evento en el que la prueba arroja una predicción negativa y el sujeto tiene un resultado positivo según el patrón oro. Con una prueba perfecta, es decir, que no arroja falsos negativos, el valor del VPN es 1 (100%), y con una prueba que no arroja verdaderos negativos, el valor del VPN es cero.

El VPN también se puede calcular a partir de la sensibilidad , la especificidad y la prevalencia :

{\text{NPV}}={\frac {{\text{specificity}}\times (1-{\text{prevalence}})}{{\text{specificity}}\times (1-{\text{prevalence}})+(1-{\text{sensitivity}})\times {\text{prevalence}}}}

{\text{NPV}}={\frac {TN}{TN+FN}}

El complemento del VPN es eltasa de falsas omisiones (FOR):

{\text{FOR}}=1-{\text{NPV}}={\frac {\text{Number of false negatives}}{{\text{Number of true negatives}}+{\text{Number of false negatives}}}}={\frac {\text{Number of false negatives}}{\text{Number of negative calls}}}

Aunque a veces se utilizan como sinónimos, un valor predictivo negativo generalmente se refiere a lo establecido por los grupos de control, mientras que una probabilidad negativa posterior a la prueba se refiere más bien a una probabilidad para un individuo. Aun así, si la probabilidad previa a la prueba del individuo de la condición objetivo es la misma que la prevalencia en el grupo de control utilizado para establecer el valor predictivo negativo, entonces los dos son numéricamente iguales.

Relación

El siguiente diagrama ilustra cómo se relacionan el valor predictivo positivo , el valor predictivo negativo , la sensibilidad y la especificidad .

^ el número de casos positivos reales en los datos
^ Un resultado de prueba que indica correctamente la presencia de una condición o característica
^ Error tipo II: Un resultado de prueba que indica erróneamente que una condición o atributo particular está ausente
^ el número de casos negativos reales en los datos
^ Un resultado de prueba que indica correctamente la ausencia de una condición o característica
^ Error tipo I: Un resultado de prueba que indica erróneamente que está presente una condición o atributo particular

Cabe señalar que los valores predictivos positivos y negativos solo se pueden estimar utilizando datos de un estudio transversal u otro estudio poblacional en el que se puedan obtener estimaciones de prevalencia válidas . Por el contrario, la sensibilidad y la especificidad se pueden estimar a partir de estudios de casos y controles .

Ejemplo resuelto

Supongamos que la prueba de detección de sangre oculta en heces (FOB) se utiliza en 2030 personas para detectar cáncer de intestino:

El pequeño valor predictivo positivo (VPP = 10%) indica que muchos de los resultados positivos de este procedimiento de prueba son falsos positivos. Por lo tanto, será necesario hacer un seguimiento de cualquier resultado positivo con una prueba más confiable para obtener una evaluación más precisa de la presencia de cáncer. No obstante, una prueba de este tipo puede ser útil si es económica y conveniente. La fortaleza de la prueba de detección FOB reside, en cambio, en su valor predictivo negativo, que, si es negativo para un individuo, nos da una gran confianza en que su resultado negativo es verdadero.

Problemas

Otros factores individuales

Cabe señalar que el VPP no es intrínseco a la prueba, sino que también depende de la prevalencia. ^[2] Debido al gran efecto de la prevalencia sobre los valores predictivos, se ha propuesto un enfoque estandarizado, en el que el VPP se normaliza a una prevalencia del 50%. ^[11] El VPP es directamente proporcional ^{[ dudoso – discutir ]} a la prevalencia de la enfermedad o afección. En el ejemplo anterior, si el grupo de personas examinadas hubiera incluido una mayor proporción de personas con cáncer de intestino, entonces el VPP probablemente sería más alto y el VPN más bajo. Si todos en el grupo tuvieran cáncer de intestino, el VPP sería del 100% y el VPN del 0%. ^{[ cita requerida ]}

Para superar este problema, el VPN y el VPP sólo se deben utilizar si la razón entre el número de pacientes en el grupo de la enfermedad y el número de pacientes en el grupo de control sano utilizado para establecer el VPN y el VPP es equivalente a la prevalencia de las enfermedades en la población estudiada o, en caso de que se comparen dos grupos de enfermedades, si la razón entre el número de pacientes en el grupo de la enfermedad 1 y el número de pacientes en el grupo de la enfermedad 2 es equivalente a la razón de las prevalencias de las dos enfermedades estudiadas. De lo contrario, las razones de verosimilitud positivas y negativas son más precisas que el VPN y el VPP, porque las razones de verosimilitud no dependen de la prevalencia. ^{[ cita requerida ]}

Cuando un individuo que se somete a la prueba tiene una probabilidad previa a la prueba de tener una afección diferente a la de los grupos de control utilizados para establecer el VPP y el VPN, el VPP y el VPN se distinguen generalmente de las probabilidades positivas y negativas posteriores a la prueba , y el VPP y el VPN se refieren a las establecidas por los grupos de control, y las probabilidades posteriores a la prueba se refieren a las del individuo examinado (según se estima, por ejemplo, mediante razones de verosimilitud ). Preferiblemente, en tales casos, se debe estudiar un grupo grande de individuos equivalentes, a fin de establecer valores predictivos positivos y negativos separados para el uso de la prueba en tales individuos. ^{[ cita requerida ]}

Actualización bayesiana

El teorema de Bayes confiere limitaciones inherentes a la precisión de las pruebas de detección en función de la prevalencia de la enfermedad o la probabilidad previa a la prueba. Se ha demostrado que un sistema de prueba puede tolerar caídas significativas en la prevalencia, hasta un cierto punto bien definido conocido como el umbral de prevalencia , por debajo del cual la confiabilidad de una prueba de detección positiva cae precipitadamente. Dicho esto, Balayla et al. ^[12] demostraron que las pruebas secuenciales superan las limitaciones bayesianas mencionadas anteriormente y, por lo tanto, mejoran la confiabilidad de las pruebas de detección. Para un valor predictivo positivo deseado , donde , que se acerca a una constante , el número de iteraciones de prueba positivas necesarias es: $\rho$ $\rho <1$ $k$ $n_{i}$

n_{i}=\lim _{k\to \rho }\left\lceil {\frac {\ln \left[{\frac {k(\phi -1)}{\phi (k-1)}}\right]}{\ln \left[{\frac {a}{1-b}}\right]}}\right\rceil

dónde

$\rho$ es el PPV deseado
$n_{i}$ es el número de iteraciones de prueba necesarias para lograr $\rho$
$a$ es la sensibilidad
$b$ es la especificidad
$\phi$ ¿Es la prevalencia de la enfermedad?

Cabe destacar que el denominador de la ecuación anterior es el logaritmo natural de la razón de verosimilitud positiva (LR+). Además, tenga en cuenta que un supuesto crítico es que las pruebas deben ser independientes. Como describen Balayla et al. ^[12] , repetir la misma prueba puede violar este supuesto de independencia y, de hecho, "Un método más natural y confiable para mejorar el valor predictivo positivo sería, cuando esté disponible, utilizar una prueba diferente con parámetros completamente diferentes después de obtener un resultado positivo inicial". ^[12 ]

Diferentes condiciones objetivo

El VPP se utiliza para indicar la probabilidad de que, en caso de que el resultado de una prueba sea positivo, el paciente realmente tenga la enfermedad especificada. Sin embargo, puede haber más de una causa de una enfermedad y una única causa potencial puede no siempre dar lugar a la enfermedad manifiesta que se observa en un paciente. Existe la posibilidad de mezclar las condiciones objetivo relacionadas del VPP y el VPN, como interpretar el VPP o el VPN de una prueba como si tuviera una enfermedad, cuando ese valor de VPP o VPN en realidad se refiere solo a una predisposición a tener esa enfermedad. ^{[ cita requerida ]}

Un ejemplo es el hisopado faríngeo microbiológico utilizado en pacientes con dolor de garganta . Por lo general, las publicaciones que indican el VPP de un hisopado faríngeo informan sobre la probabilidad de que esta bacteria esté presente en la garganta, en lugar de que el paciente esté enfermo a causa de la bacteria encontrada. Si la presencia de esta bacteria siempre resultara en dolor de garganta, entonces el VPP sería muy útil. Sin embargo, las bacterias pueden colonizar individuos de una manera inofensiva y nunca causar una infección o enfermedad. Los dolores de garganta que ocurren en estos individuos son causados por otros agentes como un virus. En esta situación, el estándar de oro utilizado en el estudio de evaluación representa solo la presencia de bacterias (que podrían ser inofensivas) pero no una enfermedad bacteriana causal de dolor de garganta. Se puede demostrar que este problema afectará el valor predictivo positivo mucho más que el valor predictivo negativo. ^[13] Para evaluar las pruebas diagnósticas en las que el estándar de oro solo analiza las causas potenciales de la enfermedad, se puede utilizar una extensión del valor predictivo denominada valor predictivo etiológico. ^[14]^[15]

Véase también

Referencias

^ Fletcher, Robert H. Fletcher; Suzanne W. (2005). Epidemiología clínica: aspectos esenciales (4.ª ed.). Baltimore, Maryland: Lippincott Williams & Wilkins. pp. 45. ISBN 0-7817-5215-9.{{cite book}}: CS1 maint: multiple names: authors list (link)
^ ab Altman, DG; Bland, JM (1994). "Pruebas diagnósticas 2: valores predictivos". BMJ . 309 (6947): 102. doi :10.1136/bmj.309.6947.102. PMC 2540558 . PMID 8038641.
^ Fawcett, Tom (2006). "Introducción al análisis ROC" (PDF) . Pattern Recognition Letters . 27 (8): 861–874. doi :10.1016/j.patrec.2005.10.010. S2CID 2027090.
^ Provost, Foster; Tom Fawcett (1 de agosto de 2013). "Ciencia de datos para empresas: lo que necesita saber sobre minería de datos y pensamiento analítico de datos". O'Reilly Media, Inc.
^ Powers, David MW (2011). "Evaluación: desde precisión, recuperación y medida F hasta ROC, información, marcación y correlación". Revista de tecnologías de aprendizaje automático . 2 (1): 37–63.
^ Ting, Kai Ming (2011). Sammut, Claude; Webb, Geoffrey I. (eds.). Enciclopedia del aprendizaje automático . Springer. doi :10.1007/978-0-387-30164-8. ISBN. 978-0-387-30164-8.
^ Brooks, Harold; Brown, Barb; Ebert, Beth; Ferro, Chris; Jolliffe, Ian; Koh, Tieh-Yong; Roebber, Paul; Stephenson, David (26 de enero de 2015). "Grupo de trabajo conjunto WWRP/WGNE sobre investigación de verificación de pronósticos". Colaboración para la investigación meteorológica y climática australiana . Organización Meteorológica Mundial . Consultado el 17 de julio de 2019 .
^ Chicco D, Jurman G (enero de 2020). "Las ventajas del coeficiente de correlación de Matthews (MCC) sobre la puntuación F1 y la precisión en la evaluación de la clasificación binaria". BMC Genomics . 21 (1): 6-1–6-13. doi : 10.1186/s12864-019-6413-7 . PMC 6941312 . PMID 31898477.
^ Chicco D, Toetsch N, Jurman G (febrero de 2021). "El coeficiente de correlación de Matthews (MCC) es más confiable que la precisión equilibrada, la información de la casa de apuestas y la marcación en la evaluación de la matriz de confusión de dos clases". Minería de datos biológicos . 14 (13): 13. doi : 10.1186/s13040-021-00244-z . PMC 7863449 . PMID 33541410.
^ Tharwat A. (agosto de 2018). "Métodos de evaluación de la clasificación". Computación e informática aplicada . 17 : 168–192. doi : 10.1016/j.aci.2018.08.003 .
^ Heston, Thomas F. (2011). "Estandarización de los valores predictivos en la investigación de diagnóstico por imágenes". Journal of Magnetic Resonance Imaging . 33 (2): 505, respuesta del autor 506–7. doi : 10.1002/jmri.22466 . PMID 21274995.
^ abc Jacques Balayla. Actualización bayesiana y pruebas secuenciales: superación de las limitaciones inferenciales de las pruebas de detección. BMC Med Inform Decis Mak 22, 6 (2022). https://doi.org/10.1186/s12911-021-01738-w
^ Orda, Ulrich; Gunnarsson, Ronny K; Orda, Sabine; Fitzgerald, Mark; Rofe, Geoffry; Dargan, Anna (2016). "Valor predictivo etiológico de un inmunoensayo rápido para la detección del antígeno de Streptococcus del grupo A en hisopados de garganta en pacientes que presentan dolor de garganta" (PDF) . Revista internacional de enfermedades infecciosas . 45 (abril): 32–5. doi : 10.1016/j.ijid.2016.02.002 . PMID 26873279.
^ Gunnarsson, Ronny K.; Lanke, Jan (2002). "El valor predictivo de las pruebas de diagnóstico microbiológico si hay portadores asintomáticos". Estadísticas en Medicina . 21 (12): 1773–85. doi :10.1002/sim.1119. PMID 12111911. S2CID 26163122.
^ Gunnarsson, Ronny K. "Calculadora de EPV". Science Network TV .