Curva ROC

El análisis ROC se aplicó posteriormente en medicina, radiología, psicología y otras áreas durante varias décadas.

El resultado del clasificador o del diagnóstico puede ser un número real (valor continuo), en cuyo caso el límite del clasificador entre cada clase debe determinarse por un valor umbral (por ejemplo para determinar si una persona tiene hipertensión basándonos en una medida de presión arterial), o puede ser un resultado discreto que indica directamente una de las clases.

Hay cuatro posibles resultados a partir de un clasificador binario como el propuesto.

Definamos un experimento a partir de P instancias positivas y N negativas.

La VPR mide hasta qué punto un clasificador o prueba diagnóstica es capaz de detectar o clasificar los casos positivos correctamente, de entre todos los casos positivos disponibles durante la prueba.

La FPR define cuántos resultados positivos son incorrectos de entre todos los casos negativos disponibles durante la prueba.

Considérense los siguientes cuatro resultados de 100 instancias positivas y otras 100 negativas: En la figura de la derecha se muestran los puntos que los cuatro ejemplos anteriores en el espacio ROC.

Para otros clasificadores, como un Clasificador bayesiano o una Red neuronal artificial, la salida son valores de probabilidad que representan hasta qué punto una instancia pertenece a una de las dos clases.

Para estos métodos se debe fijar un valor umbral que determinará un punto en el espacio ROC.

Por ejemplo, si ante una determinada magnitud fijamos ese umbral en 0.8, la probabilidad de las instancias iguales o superiores serán predichas como positivas, y los valores por debajo serán predichos como negativos.

La curva ROC se puede usar para generar estadísticos que resumen el rendimiento (o la efectividad, en su más amplio sentido) del clasificador.

Se puede demostrar que el área bajo la curva ROC es equivalente a la Prueba de Mann-Whitney, una prueba no paramétrica aplicada a dos muestras independientes, cuyos datos han sido medidos al menos en una escala de nivel ordinal.

También se ha demostrado la relación del área bajo la curva ROC con el Coeficiente de Gini, con la siguiente fórmula

Sin embargo, se ha comentado que este indicador, en general, reducir la curva ROC en varios metros, hace perder información sobre el patrón de intercambios del algoritmo discriminador en cuestión.

Finalmente en Psicofísica (preferible consultar la versión inglesa en [1]) se utiliza preferentemente d'.

Para la elección entre dos pruebas diagnósticas distintas, se recurre a las curvas ROC, ya que es una medida global e independiente del punto de corte.

La elección se realiza mediante la comparación del área bajo la curva (AUC) de ambas pruebas.

Por esto, siempre se elige la prueba diagnóstica que presente un mayor área bajo la curva.

En medicina el análisis ROC se ha utilizado de forma muy extensa en epidemiología e investigación médica, de tal modo que se encuentra muy relacionado con la medicina basada en la evidencia.

El espacio ROC y las parcelas de los cuatro ejemplos de predicción A, B, C y C'.
Diferentes curvas ROC