El reconocimiento de patrones es un campo de investigación muy activo íntimamente ligado al aprendizaje automático . También conocido como clasificación o clasificación estadística , el reconocimiento de patrones tiene como objetivo construir un clasificador que pueda determinar la clase de un patrón de entrada. Este procedimiento, conocido como entrenamiento, corresponde al aprendizaje de una función de decisión desconocida basándose únicamente en un conjunto de pares de entrada-salida que forman los datos de entrenamiento (o conjunto de entrenamiento). No obstante, en aplicaciones del mundo real como el reconocimiento de caracteres , se suele conocer de antemano cierta cantidad de información sobre el problema. La incorporación de este conocimiento previo al entrenamiento es el elemento clave que permitirá un aumento del rendimiento en muchas aplicaciones.
El conocimiento previo [1] se refiere a toda la información disponible sobre el problema además de los datos de entrenamiento. Sin embargo, en esta forma más general, determinar un modelo a partir de un conjunto finito de muestras sin conocimiento previo es un problema mal planteado , en el sentido de que puede no existir un modelo único. Muchos clasificadores incorporan el supuesto general de suavidad de que un patrón de prueba similar a una de las muestras de entrenamiento tiende a asignarse a la misma clase.
La importancia del conocimiento previo en el aprendizaje automático se sugiere por su papel en la búsqueda y la optimización. En términos generales, el teorema de que no hay almuerzo gratis establece que todos los algoritmos de búsqueda tienen el mismo rendimiento promedio en todos los problemas y, por lo tanto, implica que para ganar en rendimiento en una determinada aplicación se debe utilizar un algoritmo especializado que incluya algún conocimiento previo sobre el problema.
Los diferentes tipos de conocimiento previo encontrados en el reconocimiento de patrones ahora se reagrupan en dos categorías principales: invariancia de clase y conocimiento sobre los datos.
Un tipo muy común de conocimiento previo en el reconocimiento de patrones es la invariancia de la clase (o la salida del clasificador) ante una transformación del patrón de entrada. Este tipo de conocimiento se denomina invariancia de transformación . Las transformaciones más utilizadas en el reconocimiento de imágenes son:
Incorporar la invariancia a una transformación parametrizada en un clasificador de salida para un patrón de entrada corresponde a hacer cumplir la igualdad
La invariancia local también se puede considerar para una transformación centrada en , de modo que , utilizando la restricción
La función en estas ecuaciones puede ser la función de decisión del clasificador o su salida en valor real.
Otro enfoque consiste en considerar la invariancia de clase con respecto a un "dominio del espacio de entrada" en lugar de una transformación. En este caso, el problema se convierte en encontrar de modo que
donde es la clase de pertenencia de la región del espacio de entrada.
Un tipo diferente de invariancia de clase que se encuentra en el reconocimiento de patrones es la invariancia de permutación , es decir, la invariancia de la clase ante una permutación de elementos en una entrada estructurada. Una aplicación típica de este tipo de conocimiento previo es un clasificador invariante ante permutaciones de filas de las entradas de la matriz.
Otras formas de conocimiento previo distintas de la invariancia de clase se refieren a los datos de manera más específica y, por lo tanto, son de particular interés para las aplicaciones del mundo real. Los tres casos particulares que se dan con mayor frecuencia al recopilar datos son:
El conocimiento previo de estos puede mejorar la calidad del reconocimiento si se incluye en el aprendizaje. Además, no tener en cuenta la mala calidad de algunos datos o un gran desequilibrio entre las clases puede inducir a error en la decisión de un clasificador.