stringtranslate.com

Probabilidad previa y posterior a la prueba

La probabilidad previa a la prueba y la probabilidad posterior a la prueba (alternativamente escrita como probabilidad previa y posterior a la prueba) son las probabilidades de la presencia de una condición (como una enfermedad ) antes y después de una prueba de diagnóstico , respectivamente. La probabilidad post-prueba , a su vez, puede ser positiva o negativa , dependiendo de si la prueba cae como prueba positiva o negativa , respectivamente. En algunos casos, se utiliza para la probabilidad de desarrollar la condición de interés en el futuro.

Prueba, en este sentido, puede referirse a cualquier prueba médica (pero generalmente en el sentido de pruebas de diagnóstico) y, en un sentido amplio, también incluye preguntas e incluso suposiciones (como asumir que el individuo objetivo es una mujer o un hombre). La capacidad de marcar la diferencia entre las probabilidades previas y posteriores a la prueba de diversas afecciones es un factor importante en la indicación de pruebas médicas .

Probabilidad previa a la prueba

La probabilidad previa a la prueba de un individuo se puede elegir como una de las siguientes:

Estimación de la probabilidad post-prueba

En la práctica clínica, las probabilidades posteriores a la prueba a menudo simplemente se estiman o incluso se adivinan. Esto suele ser aceptable en el hallazgo de un signo o síntoma patognomónico , en cuyo caso es casi seguro que la afección objetivo está presente; o en ausencia de encontrar un signo o síntoma sine qua non , en cuyo caso es casi seguro que la condición objetivo está ausente.

En realidad, sin embargo, la probabilidad subjetiva de la presencia de una condición nunca es exactamente 0 o 100%. Sin embargo, existen varios métodos sistemáticos para estimar esa probabilidad. Dichos métodos suelen basarse en haber realizado previamente la prueba en un grupo de referencia en el que se conoce la presencia o ausencia de la afección (o al menos se estima mediante otra prueba que se considera altamente precisa, como por ejemplo el " Gold estándar "), en para establecer datos del desempeño de la prueba. Estos datos se utilizan posteriormente para interpretar el resultado de la prueba de cualquier individuo evaluado mediante el método. Una alternativa o complemento a los métodos basados ​​en grupos de referencia es comparar el resultado de una prueba con una prueba anterior realizada al mismo individuo, lo cual es más común en las pruebas de seguimiento .

Los métodos sistemáticos basados ​​en grupos de referencia más importantes para estimar la probabilidad post-prueba incluyen los que se resumen y comparan en la siguiente tabla, y se describen con más detalle en las secciones individuales a continuación.

Por valores predictivos

Los valores predictivos se pueden utilizar para estimar la probabilidad posterior a la prueba de un individuo si se puede suponer que la probabilidad previa a la prueba del individuo es aproximadamente igual a la prevalencia en un grupo de referencia en el que tanto los resultados de la prueba como el conocimiento sobre la presencia o ausencia del condición (por ejemplo, una enfermedad, tal como puede determinarse según el " estándar de oro ") están disponibles.

Si el resultado de la prueba es de una clasificación binaria en pruebas positivas o negativas , entonces se puede hacer la siguiente tabla:

La probabilidad previa a la prueba se puede calcular a partir del diagrama de la siguiente manera:

Probabilidad previa a la prueba = (Verdadero positivo + Falso negativo) / Muestra total

Además, en este caso, la probabilidad posprueba positiva (la probabilidad de tener la condición objetivo si la prueba resulta positiva) es numéricamente igual al valor predictivo positivo , y la probabilidad posprueba negativa (la probabilidad de tener la condición objetivo si la prueba resulta negativa) es numéricamente complementario al valor predictivo negativo ([probabilidad post-prueba negativa] = 1 - [valor predictivo negativo]), [1] suponiendo nuevamente que el individuo sometido a prueba no tiene ningún otro factores de riesgo que dan como resultado que ese individuo tenga una probabilidad previa a la prueba diferente a la del grupo de referencia utilizado para establecer los valores predictivos positivos y negativos de la prueba.

En el diagrama anterior, esta probabilidad posprueba positiva , es decir, la probabilidad posprueba de una condición objetivo dado un resultado positivo, se calcula como:

Probabilidad posprueba positiva = Verdaderos positivos / (Verdaderos positivos + Falsos positivos)

Similarmente:

La probabilidad de enfermedad post-prueba dado un resultado negativo se calcula como:

Probabilidad postest negativa = 1 - (Falsos negativos / (Falsos negativos + Verdaderos negativos))

La validez de las ecuaciones anteriores también depende de que la muestra de la población no tenga un sesgo de muestreo sustancial que haga que los grupos de aquellos que padecen la afección y aquellos que no sean sustancialmente desproporcionados de la correspondiente prevalencia y "no prevalencia" en la población. . En efecto, las ecuaciones anteriores no son válidas simplemente con un estudio de casos y controles que recopile por separado un grupo con la afección y un grupo sin ella.

Por razón de probabilidad

The above methods are inappropriate to use if the pretest probability differs from the prevalence in the reference group used to establish, among others, the positive predictive value of the test. Such difference can occur if another test preceded, or the person involved in the diagnostics considers that another pretest probability must be used because of knowledge of, for example, specific complaints, other elements of a medical history, signs in a physical examination, either by calculating on each finding as a test in itself with its own sensitivity and specificity, or at least making a rough estimation of the individual pre-test probability.

In these cases, the prevalence in the reference group is not completely accurate in representing the pre-test probability of the individual, and, consequently, the predictive value (whether positive or negative) is not completely accurate in representing the post-test probability of the individual of having the target condition.

In these cases, a posttest probability can be estimated more accurately by using a likelihood ratio for the test. Likelihood ratio is calculated from sensitivity and specificity of the test, and thereby it does not depend on prevalence in the reference group,[2] and, likewise, it does not change with changed pre-test probability, in contrast to positive or negative predictive values (which would change). Also, in effect, the validity of post-test probability determined from likelihood ratio is not vulnerable to sampling bias in regard to those with and without the condition in the population sample, and can be done as a case-control study that separately gathers those with and without the condition.

Estimation of post-test probability from pre-test probability and likelihood ratio goes as follows:[2]

In equation above, positive post-test probability is calculated using the likelihood ratio positive, and the negative post-test probability is calculated using the likelihood ratio negative.

Fagan nomogram[3]

La relación también se puede estimar mediante el llamado nomograma de Fagan (que se muestra a la derecha) trazando una línea recta desde el punto de la probabilidad previa a la prueba dada hasta el índice de verosimilitud dado en sus escalas, que, a su vez, estima la probabilidad posterior a la prueba . -Probabilidad de prueba en el punto donde esa línea recta cruza su escala.

La probabilidad posterior a la prueba puede, a su vez, utilizarse como probabilidad previa a la prueba para pruebas adicionales si continúa calculándose de la misma manera. [2]

Es posible realizar un cálculo de razones de verosimilitud para pruebas con valores continuos o más de dos resultados que es similar al cálculo para resultados dicotómicos. Para este propósito, se calcula un índice de probabilidad separado para cada nivel de resultado de la prueba y se denomina índices de probabilidad específicos de intervalo o estrato. [4]

Ejemplo

A un individuo se le realizó la prueba de sangre oculta en heces (FOB) para estimar la probabilidad de que esa persona tuviera la condición objetivo de cáncer de intestino, y resultó positiva (se detectó sangre en las heces). Antes de la prueba, ese individuo tenía una probabilidad previa a la prueba de tener cáncer de intestino de, por ejemplo, 3% (0,03), como podría haberse estimado mediante la evaluación de, por ejemplo, el historial médico, el examen y las pruebas previas de ese individuo. .

La sensibilidad, especificidad, etc. de la prueba FOB se establecieron con una muestra de población de 203 personas (sin dicha herencia) y quedaron de la siguiente manera:

A partir de esto, se pueden establecer los ratios de verosimilitud de la prueba: [2]

  1. Razón de probabilidad positiva = sensibilidad / (1 − especificidad) = 66,67% / (1 − 91%) = 7,4
  2. Razón de probabilidad negativa = (1 − sensibilidad) / especificidad = (1 − 66,67%) / 91% = 0,37

Por lo tanto, ese individuo tiene una probabilidad post-prueba (o "riesgo post-prueba") del 18,6% de tener cáncer de intestino.

La prevalencia en la muestra de población se calcula como:

La probabilidad previa a la prueba del individuo era más del doble que la de la muestra de población, aunque la probabilidad posterior a la prueba del individuo era menor que el doble de la de la muestra de población (que se estima por el valor predictivo positivo de la prueba del 10%) , lo contrario de lo que resultaría con un método menos preciso de simplemente multiplicar los riesgos relativos.

Fuentes específicas de inexactitud

Las fuentes específicas de inexactitud cuando se utiliza el índice de verosimilitud para determinar una probabilidad posterior a la prueba incluyen la interferencia con determinantes o pruebas anteriores o la superposición de objetivos de prueba, como se explica a continuación:

Interferencia con la prueba

La probabilidad posterior a la prueba , estimada a partir de la probabilidad previa a la prueba con el índice de verosimilitud , debe manejarse con precaución en individuos con otros determinantes (como factores de riesgo) distintos de la población general, así como en individuos que se han sometido a pruebas anteriores, porque Dichos determinantes o pruebas también pueden influir en la propia prueba de manera impredecible, provocando resultados inexactos. Un ejemplo con el factor de riesgo de la obesidad es que la grasa abdominal adicional puede dificultar la palpación de los órganos abdominales y disminuir la resolución de la ecografía abdominal y, de manera similar, el contraste de bario remanente de una radiografía previa puede interferir con exámenes abdominales posteriores, [5] en efecto que disminuye las sensibilidades y especificidades de dichas pruebas posteriores. Por otro lado, el efecto de la interferencia puede mejorar potencialmente la eficacia de pruebas posteriores en comparación con el uso en el grupo de referencia, como que algunos exámenes abdominales sean más fáciles cuando se realizan en personas con bajo peso.

Superposición de pruebas

Además, la validez de los cálculos sobre cualquier probabilidad previa a la prueba que a su vez se derive de una prueba anterior depende de que las dos pruebas no se superpongan significativamente con respecto al parámetro objetivo que se está analizando, como los análisis de sangre de sustancias pertenecientes a uno y al otro. misma vía metabólica trastornada . Un ejemplo del extremo de tal superposición es cuando se ha establecido la sensibilidad y especificidad para un análisis de sangre que detecta la "sustancia X", y también para uno que detecta la "sustancia Y". Si, de hecho, la "sustancia X" y la "sustancia Y" son la misma sustancia, entonces, realizar dos pruebas consecutivas de una misma sustancia puede no tener ningún valor diagnóstico, aunque el cálculo parece mostrar una diferencia. A diferencia de la interferencia descrita anteriormente, el aumento de la superposición de pruebas sólo disminuye su eficacia. En el ámbito médico, la validez diagnóstica aumenta al combinar pruebas de diferentes modalidades para evitar una superposición sustancial, por ejemplo al realizar una combinación de un análisis de sangre, una biopsia y una radiografía .

Métodos para superar la inexactitud.

Para evitar tales fuentes de inexactitud mediante el uso de razones de verosimilitud, el método óptimo sería reunir un gran grupo de referencia de individuos equivalentes, con el fin de establecer valores predictivos separados para el uso de la prueba en dichos individuos. Sin embargo, con un mayor conocimiento de la historia médica de un individuo, el examen físico y las pruebas previas, etc., ese individuo se vuelve más diferenciado, con una dificultad cada vez mayor para encontrar un grupo de referencia para establecer valores predictivos personalizados, lo que hace que una estimación de la probabilidad posterior a la prueba mediante valores predictivos no sea válida. .

Otro método para superar tales imprecisiones es evaluar el resultado de la prueba en el contexto de los criterios de diagnóstico, como se describe en la siguiente sección.

Por riesgo relativo

La probabilidad posterior a la prueba a veces se puede estimar multiplicando la probabilidad previa a la prueba por un riesgo relativo dado por la prueba. En la práctica clínica, esto suele aplicarse en la evaluación del historial médico de un individuo, donde la "prueba" suele ser una pregunta (o incluso una suposición) sobre diversos factores de riesgo, por ejemplo, el sexo, el tabaquismo o el peso, pero puede potencialmente ser una prueba sustancial, como poner al individuo en una balanza . Cuando se utilizan riesgos relativos, la probabilidad resultante suele estar más bien relacionada con que el individuo desarrolle la afección durante un período de tiempo (de manera similar a la incidencia en una población), en lugar de ser la probabilidad de que un individuo tenga la afección en el presente, pero puede ser indirectamente una estimación de este último.

El uso del índice de riesgo se puede utilizar de manera algo similar al riesgo relativo.

Un factor de riesgo

Para establecer un riesgo relativo, el riesgo en un grupo expuesto se divide por el riesgo en un grupo no expuesto.

Si sólo se tiene en cuenta un factor de riesgo de un individuo, la probabilidad post-prueba se puede estimar multiplicando el riesgo relativo por el riesgo en el grupo de control. El grupo de control suele representar a la población no expuesta, pero si una fracción muy baja de la población está expuesta, entonces a menudo se puede suponer que la prevalencia en la población general es igual a la prevalencia en el grupo de control. En tales casos, la probabilidad post-prueba se puede estimar multiplicando el riesgo relativo por el riesgo en la población general.

Por ejemplo, la incidencia de cáncer de mama en una mujer en el Reino Unido entre 55 y 59 años se estima en 280 casos por 100.000 por año, [6] y el factor de riesgo de haber estado expuesta a altas dosis de radiación ionizante en el pecho (por ejemplo, como tratamientos para otros cánceres) confiere un riesgo relativo de cáncer de mama entre 2,1 y 4,0, [7] en comparación con las personas no expuestas. Debido a que una pequeña fracción de la población está expuesta, se puede suponer que la prevalencia en la población no expuesta es igual a la prevalencia en la población general. Posteriormente, se puede estimar que una mujer en Reino Unido que tenga entre 55 y 59 años y que haya estado expuesta a altas dosis de radiaciones ionizantes debería tener un riesgo de desarrollar cáncer de mama en un periodo de un año de entre 588 y 1.120. en 100.000 (es decir, entre el 0,6% y el 1,1%).

Múltiples factores de riesgo

Teóricamente, el riesgo total en presencia de múltiples factores de riesgo se puede estimar multiplicando por cada riesgo relativo, pero generalmente es mucho menos preciso que usar índices de probabilidad y generalmente se hace solo porque es mucho más fácil de realizar cuando solo se consideran los riesgos relativos. dados, en comparación con, por ejemplo, convertir los datos de origen en sensibilidades y especificidades y calcularlos mediante índices de probabilidad. Del mismo modo, en la literatura a menudo se dan riesgos relativos en lugar de índices de probabilidad porque el primero es más intuitivo. Las fuentes de inexactitud al multiplicar los riesgos relativos incluyen:

El efecto (mencionado en último lugar) de la sobreestimación puede compensarse convirtiendo los riesgos en probabilidades y los riesgos relativos en probabilidades . Sin embargo, esto no compensa el efecto (mencionado anteriormente) de cualquier diferencia entre la probabilidad previa a la prueba de un individuo y la prevalencia en el grupo de referencia.

Un método para compensar las dos fuentes de inexactitud mencionadas anteriormente es establecer los riesgos relativos mediante un análisis de regresión multivariado. Sin embargo, para conservar su validez, los riesgos relativos establecidos como tales deben multiplicarse por todos los demás factores de riesgo en el mismo análisis de regresión, y sin agregar otros factores más allá del análisis de regresión.

Además, multiplicar múltiples riesgos relativos tiene el mismo riesgo de pasar por alto superposiciones importantes de los factores de riesgo incluidos, de manera similar a cuando se utilizan índices de probabilidad. Además, diferentes factores de riesgo pueden actuar en sinergia , con el resultado de que, por ejemplo, dos factores que individualmente tienen un riesgo relativo de 2 tienen un riesgo relativo total de 6 cuando ambos están presentes, o pueden inhibirse entre sí, de manera algo similar a la interferencia descrita para el uso de razones de verosimilitud.

Por criterios diagnósticos y reglas de predicción clínica.

La mayoría de las enfermedades importantes tienen criterios de diagnóstico establecidos y/o reglas de predicción clínica . El establecimiento de criterios diagnósticos o reglas de predicción clínica consiste en una evaluación integral de muchas pruebas que se consideran importantes para estimar la probabilidad de una condición de interés, incluyendo en ocasiones también cómo dividirla en subgrupos, y cuándo y cómo tratar la condición. Dicho establecimiento puede incluir el uso de valores predictivos, índices de probabilidad y riesgos relativos.

Por ejemplo, los criterios ACR para el lupus eritematoso sistémico definen el diagnóstico como la presencia de al menos 4 de 11 hallazgos, cada uno de los cuales puede considerarse como un valor objetivo de una prueba con su propia sensibilidad y especificidad. En este caso, se han evaluado las pruebas para estos parámetros objetivo cuando se utilizan en combinación con respecto a, por ejemplo, interferencia entre ellos y superposición de parámetros objetivo, esforzándose así por evitar imprecisiones que de otro modo podrían surgir al intentar calcular la probabilidad. de la enfermedad utilizando ratios de probabilidad de las pruebas individuales. Por lo tanto, si se han establecido criterios de diagnóstico para una condición, generalmente es más apropiado interpretar cualquier probabilidad posterior a la prueba para esa condición en el contexto de estos criterios.

Además, existen herramientas de evaluación de riesgos para estimar el riesgo combinado de varios factores de riesgo, como la herramienta en línea [1] del Framingham Heart Study para estimar el riesgo de resultados de enfermedad coronaria utilizando múltiples factores de riesgo, incluidos la edad, el sexo y la sangre. lípidos, presión arterial y tabaquismo, siendo mucho más preciso que multiplicar los riesgos relativos individuales de cada factor de riesgo.

Aún así, un médico experimentado puede estimar la probabilidad posterior a la prueba (y las acciones que motiva) mediante una consideración amplia que incluya criterios y reglas además de otros métodos descritos anteriormente, incluidos tanto los factores de riesgo individuales como el rendimiento de las pruebas que se han realizado. .

Uso clínico de probabilidades previas y posteriores a la prueba.

Un parámetro clínicamente útil es la diferencia absoluta (en lugar de relativa y no negativa) entre la probabilidad previa y posterior a la prueba, calculada como:

Diferencia absoluta = | (probabilidad previa a la prueba) - (probabilidad posterior a la prueba) |

Un factor importante para tal diferencia absoluta es el poder de la prueba en sí, que puede describirse en términos de, por ejemplo, sensibilidad y especificidad o índice de probabilidad. Otro factor es la probabilidad previa a la prueba, donde una menor probabilidad previa a la prueba da como resultado una diferencia absoluta más baja, con la consecuencia de que incluso pruebas muy potentes logran una diferencia absoluta baja para condiciones muy improbables en un individuo (como las enfermedades raras en el mundo). ausencia de cualquier otro signo indicador), pero por otro lado, que incluso las pruebas con baja potencia pueden marcar una gran diferencia en condiciones muy sospechadas.

Es posible que también sea necesario considerar las probabilidades en este sentido en el contexto de condiciones que no son objetivos principales de la prueba, como las probabilidades relativas al perfil en un procedimiento de diagnóstico diferencial .

La diferencia absoluta se puede poner en relación con el beneficio para un individuo que logra un examen médico , que se puede estimar aproximadamente como:

, dónde:

En esta fórmula, lo que constituye beneficio o daño varía en gran medida según los valores personales y culturales , pero aún se pueden sacar conclusiones generales. Por ejemplo, si el único efecto esperado de una prueba médica es hacer que una enfermedad sea más probable que otra, pero las dos enfermedades tienen el mismo tratamiento (o ninguna puede ser tratada), entonces r i = 0 y la prueba esencialmente no tiene ningún efecto. beneficio para el individuo.

Los factores adicionales que influyen en la decisión de si se debe realizar o no una prueba médica incluyen: costo de la prueba, disponibilidad de pruebas adicionales, posible interferencia con pruebas posteriores (como una palpación abdominal que potencialmente induce actividad intestinal cuyos sonidos interfieren con una auscultación abdominal posterior). ), tiempo empleado en la realización de la prueba u otros aspectos prácticos o administrativos. Además, incluso si no son beneficiosos para el individuo que se realiza la prueba, los resultados pueden ser útiles para el establecimiento de estadísticas con el fin de mejorar la atención médica de otros individuos.

Subjetividad

Las probabilidades previas y posteriores a la prueba son subjetivas y se basan en el hecho de que, en realidad, un individuo tiene la afección o no (siendo siempre la probabilidad del 100%), por lo que las probabilidades previas y posteriores a la prueba para los individuos pueden considerarse más bien como fenómenos psicológicos en las mentes de quienes participan en el diagnóstico en cuestión.

Ver también

Referencias

  1. ^ Curso en línea de práctica basada en evidencia por Mark Ebell. Facultad de Salud Pública, Universidad de Georgia. Consultado en agosto de 2011.
  2. ^ abcd Ratios de probabilidad Archivado el 22 de diciembre de 2010 en Wayback Machine , del CEBM (Centro de Medicina Basada en Evidencia). Última edición de la página: 1 de febrero de 2009. Cuando se utilizan en ejemplos, las fórmulas generales se toman de referencia, mientras que los números de ejemplo son diferentes.
  3. ^ Parámetros tomados de la imagen en: Zhang W, Doherty M, Pascual E, et al. (octubre de 2006). "Recomendaciones EULAR basadas en evidencia para la gota. Parte I: Diagnóstico. Informe de un grupo de trabajo del Comité Permanente de Estudios Clínicos Internacionales que Incluyen Terapéutica (ESCISIT)". Ana. Reuma. Dis . 65 (10): 1301–11. doi :10.1136/ard.2006.055251. PMC  1798330 . PMID  16707533.
  4. ^ Marrón MD, Reeves MJ (2003). "Medicina de emergencia basada en evidencia/habilidades para atención de emergencia basada en evidencia. Razones de probabilidad de intervalo: otra ventaja para el diagnosticador basado en evidencia". Ann Emerg Med . 42 (2): 292–297. doi : 10.1067/mem.2003.274 . PMID  12883521.
  5. ^ Página 750 (Capítulo 10) en: Dunning, Marshall Barnett; Fischbach, Frances Talaska (2009). Un manual de pruebas de laboratorio y diagnóstico [recurso electrónico] . Filadelfia: Wolters Kluwer Health/Lippincott Williams & Wilkins. ISBN 978-0-7817-7194-8.
  6. ^ Gráfico de Excel para la Figura 1.1: Cáncer de mama (C50), número promedio de casos nuevos por año y tasas de incidencia específicas por edad, Reino Unido, 2006-2008 en Cáncer de mama: estadísticas de incidencia del Reino Unido Archivado el 14 de mayo de 2012 en Wayback Machine en Cancer Research REINO UNIDO. Sección actualizada el 18/07/11.
  7. ^ ACS (2005). "Datos y cifras sobre el cáncer de mama 2005-2006" (PDF) . Archivado desde el original (PDF) el 13 de junio de 2007 . Consultado el 26 de abril de 2007 .
  8. ^ Agoritsas, T.; Courvoisier, DS; Combescure, C.; Deom, M.; Perneger, TV (2010). "¿Importa la prevalencia para los médicos al estimar la probabilidad de enfermedad posterior a la prueba? Un ensayo aleatorizado". Revista de Medicina Interna General . 26 (4): 373–378. doi :10.1007/s11606-010-1540-5. PMC 3055966 . PMID  21053091. 
  9. ^ 2% dado a partir de una incidencia acumulada de 2.075 casos por 100.000 en mujeres más jóvenes hasta los 39 años, de la referencia anterior de Cancer Research UK.
  10. ^ Satagopan, JM; Offit, K.; Foulkes, W.; Robson, YO; Wacholder, S.; Ing, CM; Karp, SE; Begg, CB (2001). "Los riesgos de por vida de cáncer de mama en portadores judíos asquenazíes de mutaciones BRCA1 y BRCA2". Epidemiología, biomarcadores y prevención del cáncer . 10 (5): 467–473. PMID  11352856.