Validación cruzada

[1]​ Es una técnica muy utilizada en proyectos de inteligencia artificial para validar modelos generados.

Debido a estas carencias aparece el concepto de validación cruzada.

El resultado final se corresponde a la media aritmética de los valores obtenidos para las diferentes divisiones.

Pero, en cambio, con este método hay algunas muestras que quedan sin evaluar y otras que se evalúan más de una vez, es decir, los subconjuntos de prueba y entrenamiento se pueden solapar.

Así mismo, se podrían utilizar otras medidas como el valor predictivo positivo.

Con la validación cruzada podríamos comparar los dos procedimientos y determinar cuál de los dos es el más preciso.

La validación cruzada de "k" iteraciones (k-fold cross validation) nos permite evaluar también modelos en los que se utilizan varios clasificadores.

Continuando con el ejemplo anterior, si tenemos un detector que nos determina si en una imagen aparece un hombre o una mujer, y éste utiliza cuatro clasificadores binarios para detectarlo, también podemos utilizar la validación cruzada para evaluar su precisión.

En muchas aplicaciones de modelado predictivo, la estructura del sistema que está siendo estudiado evoluciona con el tiempo.

Esto puede introducir diferencias sistemáticas entre los conjuntos de entrenamiento y validación.

Otro ejemplo, supongamos que se desarrolla un modelo para predecir el riesgo de un individuo para ser diagnosticado con una enfermedad en particular en el próximo año.

Sin embargo, hay muchas maneras en que la validación cruzada puede ser mal utilizada.

Esquema k-fold cross validation, con k=4 y un solo clasificador. [ 2 ]
Método de retención.
Validación cruzada de K iteraciones con K =4.
Validación cruzada aleatória con k iteraciones.
Validación cruzada dejando uno fuera (LOOCV) .
k-fold cross validation, con k=4 y con 4 clasificadores.