En bioestadística , el sesgo de espectro se refiere al fenómeno de que el rendimiento de una prueba diagnóstica puede variar en diferentes entornos clínicos porque cada entorno tiene una mezcla diferente de pacientes. [1] Debido a que el rendimiento puede depender de la mezcla de pacientes, el rendimiento en una clínica puede no ser predictivo del rendimiento en otra clínica. [2] Estas diferencias se interpretan como una especie de sesgo . Matemáticamente, el sesgo de espectro es un sesgo de muestreo y no un sesgo estadístico tradicional ; esto ha llevado a algunos autores a referirse al fenómeno como efectos de espectro , [3] mientras que otros sostienen que es un sesgo si el verdadero rendimiento de la prueba difiere de lo que se "espera". [2] Por lo general, el rendimiento de una prueba diagnóstica se mide en términos de su sensibilidad y especificidad y son los cambios en estos los que se consideran cuando se hace referencia al sesgo de espectro. Sin embargo, otras medidas de rendimiento, como las razones de verosimilitud, también pueden verse afectadas por el sesgo de espectro. [2]
En general, se considera que el sesgo de espectro tiene tres causas. [2] La primera se debe a un cambio en la combinación de casos de aquellos pacientes con el trastorno objetivo (enfermedad) y esto afecta la sensibilidad . La segunda se debe a un cambio en la combinación de casos de aquellos sin el trastorno objetivo (libres de enfermedad) y esto afecta la especificidad . La tercera se debe a un cambio en la prevalencia, y esto afecta tanto a la sensibilidad como a la especificidad . [4] Esta última causa no es ampliamente apreciada, pero hay evidencia empírica creciente [4] [5] así como argumentos teóricos [6] que sugieren que de hecho afecta el rendimiento de una prueba.
Se pueden encontrar ejemplos en los que la sensibilidad y la especificidad cambian entre diferentes subgrupos de pacientes con la prueba del antígeno carcinoembrionario [7] y las pruebas de tira reactiva urinaria . [8]
Los resultados de las pruebas diagnósticas informados por algunos estudios pueden estar sobreestimados artificialmente si se trata de un diseño de caso-control en el que se compara una población sana ('la más apta de las aptas') con una población con enfermedad avanzada ('la más enferma de las enfermas'); es decir, se comparan dos poblaciones extremas, en lugar de poblaciones típicas sanas y enfermas. [9]
Si se analiza adecuadamente, el reconocimiento de la heterogeneidad de los subgrupos puede conducir a conocimientos sobre el rendimiento de la prueba en distintas poblaciones. [3]