Estándar de oro (prueba)

En medicina y estadística médica , el estándar de oro , estándar de criterio , ^[1] o estándar de referencia ^[2] es la prueba de diagnóstico o punto de referencia que es el mejor disponible en condiciones razonables . ^[3] Es la prueba con la que se comparan nuevas pruebas para medir su validez y se utiliza para evaluar la eficacia de los tratamientos. ^[1]

Los significados pueden diferir entre la medicina práctica y el ideal estadístico porque, en la medicina con algunas condiciones, sólo una autopsia garantiza certeza diagnóstica, por lo que la prueba estándar de oro sería la mejor que mantiene vivo al paciente en lugar de la autopsia. En estos casos, incluso las pruebas denominadas "estándar de oro" requieren un seguimiento para confirmar o refutar el diagnóstico. ^[4]

Historia

El término "patrón oro" en su sentido actual en la investigación médica fue acuñado por Rudd en 1979, en referencia al patrón oro monetario. ^[5]

En medicina

El "estándar de oro" puede referirse a los criterios mediante los cuales se evalúa la evidencia científica. Por ejemplo, en la investigación sobre reanimación , la prueba "estándar de oro" de un medicamento o procedimiento es si conduce o no a un aumento en el número de sobrevivientes neurológicamente intactos que salen del hospital. ^[6] Otros tipos de investigación médica podrían considerar una disminución significativa de la mortalidad a 30 días como el estándar de oro. ^{[ cita necesaria ]}

La Guía de estilo de la AMA ha preferido la frase criterio estándar en lugar de "estándar de oro". Otras revistas también han emitido mandatos en sus instrucciones para los contribuyentes. Por ejemplo, los Archivos de Medicina Biológica y Rehabilitación especifican este uso. ^[7] En la práctica, sin embargo, la adopción de este término por parte de los autores, así como su aplicación por parte del personal editorial, es notablemente pobre, al menos para las revistas de la AMA. ^[8]

Cuando el criterio es un procedimiento de prueba clínica completo, generalmente se lo denomina definición de caso clínico . Las diferentes definiciones de casos pueden producir resultados tremendamente diferentes cuando se utilizan como base para evaluar un método de diagnóstico determinado. ^[9]

Una prueba hipotética ideal "estándar de oro" tiene una sensibilidad del 100% con respecto a la presencia de la enfermedad (identifica a todos los individuos con un proceso de enfermedad bien definido; no tiene ningún resultado falso negativo) y una especificidad del 100% ( no identifica falsamente a alguien con una condición que no la tiene; no tiene ningún resultado falso positivo). En la práctica, a veces no existen pruebas verdaderamente estándar de oro. ^[10]

A medida que se disponga de nuevos métodos de diagnóstico, la prueba "estándar de oro" puede cambiar con el tiempo. Por ejemplo, para el diagnóstico de disección aórtica , la prueba de referencia solía ser el aortograma , que tenía una sensibilidad tan baja como el 83% y una especificidad tan baja como el 87%. Desde los avances de la resonancia magnética , la angiografía por resonancia magnética (ARM) se ha convertido en la nueva prueba de referencia para la disección aórtica, con una sensibilidad del 95% y una especificidad del 92%. ^{[ cita necesaria ]} Antes de la aceptación generalizada de cualquier prueba nueva, la prueba anterior conserva su condición de "estándar de oro".

Calibración de prueba

Debido a que las pruebas pueden ser incorrectas (producir un falso negativo o un falso positivo ), los resultados deben interpretarse en el contexto de la historia, los hallazgos físicos y otros resultados de las pruebas del individuo que se está examinando. Es en este contexto que se determina la sensibilidad y especificidad de la prueba "estándar de oro". ^{[ cita necesaria ]}

Cuando el estándar de oro no es perfecto, su sensibilidad y especificidad deben calibrarse con pruebas más precisas o con la definición de la afección. ^[11] Esta calibración es especialmente importante cuando una prueba perfecta sólo está disponible mediante autopsia. Es importante enfatizar que una prueba debe alcanzar algún acuerdo entre observadores, para evitar algún sesgo inducido por el propio estudio. ^[12]

Los errores de calibración pueden provocar diagnósticos erróneos . ^[13]^{[ dudoso – discutir ]}

Ambigüedad

A veces, la "prueba estándar de oro" se refiere a la prueba de mejor rendimiento disponible. En estos casos, no existe otro criterio con el que compararlo y equivale a una definición. Cuando se hace referencia a este significado, las pruebas estándar de oro normalmente no se realizan en absoluto. Esto se debe a que la prueba estándar de oro puede ser difícil de realizar o imposible de realizar en una persona viva (es decir, la prueba se realiza como parte de una autopsia o puede tomar demasiado tiempo hasta que los resultados de la prueba estén disponibles para ser clínicamente válidos). útil).

Otras veces, el "estándar de oro" no se refiere a la prueba de mejor rendimiento disponible, sino a la mejor disponible en condiciones razonables. Por ejemplo, en este sentido, una resonancia magnética es el estándar de oro para el diagnóstico de tumores cerebrales, aunque no es tan buena como una biopsia. En este caso, la sensibilidad y especificidad del patrón oro no son del 100% y se dice que es un "patrón oro imperfecto" o "patrón oro aleado". ^[11]

El término verdad fundamental se refiere al estado absoluto subyacente de la información; el patrón oro se esfuerza por representar la verdad fundamental lo más fielmente posible. Si bien el estándar de oro es el mejor esfuerzo para obtener la verdad, la verdad sobre el terreno generalmente se recopila mediante observaciones directas. En el aprendizaje automático y la recuperación de información , "verdad fundamental" es el término preferido incluso cuando las clasificaciones pueden ser imperfectas; Se supone que el patrón oro es la verdad fundamental. ^{[ cita necesaria ]}

Algunos autores utilizan el término "estándar de oro". Claassen sostiene que este uso es incorrecto, ya que "estándar de oro" implica un nivel de perfección que es inalcanzable en la ciencia médica. ^[5]

Ver también

Referencias

^ ab Borowitz D, Aronoff N, Cummings LC, Maqbool A, Mulberg AE (abril de 2022). "Coeficiente de absorción de grasas para medir la eficacia de la terapia de reemplazo de enzimas pancreáticas en personas con fibrosis quística: ¿estándar de oro o estándar de carbón?". Páncreas . 51 (4): 310–318. doi :10.1097/MPA.0000000000002016. PMC 9257055 . PMID 35695742.
^ Oro, R; Reichman, M; Greenberg, E; Ivanidze, J; Elías, E; Tsiouris, AJ; Comunale, JP; Johnson, CE; Sanelli, PC (septiembre de 2010). "Desarrollo de un nuevo estándar de referencia: ¿es necesaria la validación?". Radiología Académica . 17 (9): 1079–82. doi :10.1016/j.acra.2010.05.021. PMC 2919497 . PMID 20692619.
^ Versi E (julio de 1992). ""Estándar de oro" es un término apropiado". BMJ . 305 (6846): 187. doi :10.1136/bmj.305.6846.187-b. PMC 1883235 . PMID 1515860.
^ Fardy, John M.; Barrett, Brendan J. (2015). "Evaluación de Pruebas Diagnósticas". Epidemiología clínica (PDF) . Métodos en biología molecular. vol. 1281, págs. 289–300. doi :10.1007/978-1-4939-2428-8_17. ISBN 978-1-4939-2427-1. PMID 25694317.
^ ab Claassen, JA (24 de diciembre de 2005). "['Estándar de oro', no 'estándar de oro']". Nederlands Tijdschrift voor Geneeskunde . 149 (52): 2937. PMID 16402524.
^ ACLS: principios y práctica . pag. 62. Dallas: Asociación Estadounidense del Corazón, 2003. ISBN 0-87493-341-2 .
^ "Guía para autores". Archivos de Medicina Biológica y Rehabilitación . Elsevier .
^ "Estándar de criterio: AMA Style Insider". 21 de junio de 2011 . Consultado el 18 de mayo de 2021 .
^ Bachmann, Lucas M; Juni, Peter; Reichenbach, Stephan; Ziswiler, Hans-Rudolf; Kessels, Alfons G; Vögelin, Esther (1 de agosto de 2005). "Consecuencias de diferentes 'estándares de oro' de diagnóstico en la investigación de la precisión de las pruebas: el síndrome del túnel carpiano como ejemplo". Revista Internacional de Epidemiología . 34 (4): 953–955. doi : 10.1093/ije/dyi105 . PMID 15911545.
^ Troy LM, Michels KB, Hunter DJ, Spiegelman D, Manson JE, Colditz GA y otros. (Febrero de 1996). "Peso al nacer autoinformado e historial de haber sido amamantados entre mujeres más jóvenes: una evaluación de la validez". Revista Internacional de Epidemiología . 25 (1): 122-127. doi : 10.1093/ije/25.1.122 . PMID 8666479.
^ ab Spiegelman D, Schneeweiss S, McDermott A (enero de 1997). "Corrección de errores de medición para modelos de regresión logística con un" patrón oro aleado"". Revista Estadounidense de Epidemiología . 145 (2): 184-196. doi : 10.1093/oxfordjournals.aje.a009089 . PMID 9006315.
^ Stein PD, Athanasoulis C, Alavi A, Greenspan RH, Hales CA, Saltzman HA, et al. (febrero de 1992). "Complicaciones y validez de la angiografía pulmonar en la embolia pulmonar aguda". Circulación . 85 (2): 462–468. doi : 10.1161/01.CIR.85.2.462 . PMID 1735144.
^ Gallaher MP, Mobley LR, Klee GG, Schryver P (abril de 2004). El impacto del error de calibración en la toma de decisiones médicas (PDF) (Reporte). Washington (DC): Instituto Nacional de Estándares y Tecnología.

enlaces externos

Prueba de oro más fácil