Conocimientos previos para el reconocimiento de patrones.

El reconocimiento de patrones es un campo de investigación muy activo íntimamente ligado al aprendizaje automático . También conocido como clasificación o clasificación estadística , el reconocimiento de patrones tiene como objetivo construir un clasificador que pueda determinar la clase de un patrón de entrada. Este procedimiento, conocido como entrenamiento, corresponde al aprendizaje de una función de decisión desconocida basándose únicamente en un conjunto de pares entrada-salida que forman los datos de entrenamiento (o conjunto de entrenamiento). Sin embargo, en aplicaciones del mundo real como el reconocimiento de caracteres , normalmente se conoce de antemano cierta cantidad de información sobre el problema. La incorporación de estos conocimientos previos a la formación es el elemento clave que permitirá un aumento del rendimiento en muchas aplicaciones. $({\boldsymbol {x}}_{i},y_{i})$

Conocimiento previo

El conocimiento previo ^[1] se refiere a toda la información disponible sobre el problema además de los datos de entrenamiento. Sin embargo, en esta forma más general, determinar un modelo a partir de un conjunto finito de muestras sin conocimiento previo es un problema mal planteado , en el sentido de que puede no existir un modelo único. Muchos clasificadores incorporan el supuesto general de suavidad de que un patrón de prueba similar a una de las muestras de entrenamiento tiende a asignarse a la misma clase.

La importancia del conocimiento previo en el aprendizaje automático se sugiere por su papel en la búsqueda y optimización. En términos generales, el teorema del almuerzo gratis establece que todos los algoritmos de búsqueda tienen el mismo rendimiento promedio en todos los problemas y, por lo tanto, implica que para ganar rendimiento en una determinada aplicación se debe utilizar un algoritmo especializado que incluya algún conocimiento previo sobre el problema.

Los diferentes tipos de conocimiento previo que se encuentran en el reconocimiento de patrones ahora se reagrupan en dos categorías principales: invariancia de clase y conocimiento de los datos.

Invariancia de clase

Un tipo de conocimiento previo muy común en el reconocimiento de patrones es la invariancia de la clase (o la salida del clasificador) ante una transformación del patrón de entrada. A este tipo de conocimiento se le conoce como transformación-invariancia . Las transformaciones más utilizadas en el reconocimiento de imágenes son:

Incorporar la invariancia a una transformación parametrizada en un clasificador de salida para un patrón de entrada corresponde a hacer cumplir la igualdad. $T_{\theta}:{\boldsymbol {x}}\mapsto T_{\theta} {\boldsymbol {x}}$ $\theta$ $f({\boldsymbol {x}})$ ${\boldsymbol {x}}$

f({\boldsymbol {x}})=f(T_{\theta }{\boldsymbol {x}}),\quad \forall {\boldsymbol {x}},\theta .

También se puede considerar la invariancia local para una transformación centrada en , de modo que , usando la restricción $\theta =0$ $T_{0}{\boldsymbol {x}}={\boldsymbol {x}}$

\left.{\frac {\partial }{\partial \theta }}\right|_{\theta =0}f(T_{\theta }{\boldsymbol {x}})=0.

La función en estas ecuaciones puede ser la función de decisión del clasificador o su salida de valor real. $f$

Otro enfoque es considerar la invariancia de clase con respecto a un "dominio del espacio de entrada" en lugar de una transformación. En este caso, el problema es encontrar de modo que $f$

f({\boldsymbol {x}})=y_{\mathcal {P}},\ \forall {\boldsymbol {x}}\in {\mathcal {P}},

donde está la clase de membresía de la región del espacio de entrada. $y_{\mathcal {P}}$ ${\mathcal {P}}$

Un tipo diferente de invariancia de clase que se encuentra en el reconocimiento de patrones es la invariancia de permutación , es decir, la invariancia de la clase ante una permutación de elementos en una entrada estructurada. Una aplicación típica de este tipo de conocimiento previo es un clasificador invariante a permutaciones de filas de las entradas de la matriz.

Conocimiento de los datos.

Otras formas de conocimiento previo además de la invariancia de clases se refieren a los datos más específicamente y, por lo tanto, son de particular interés para aplicaciones del mundo real. Los tres casos particulares que se dan con mayor frecuencia a la hora de recopilar datos son:

Hay muestras sin etiquetar disponibles con supuestas pertenencias a una clase;
Desequilibrio del conjunto de entrenamiento debido a una alta proporción de muestras de una clase;
La calidad de los datos puede variar de una muestra a otra.

El conocimiento previo de estos puede mejorar la calidad del reconocimiento si se incluye en el aprendizaje. Además, no tener en cuenta la mala calidad de algunos datos o un gran desequilibrio entre las clases puede inducir a error en la decisión de un clasificador.

Notas

^ B. Scholkopf y A. Smola, "Aprender con kernels", MIT Press 2002.

Referencias

E. Krupka y N. Tishby, "Incorporación de conocimientos previos sobre características en el aprendizaje", Undécima Conferencia Internacional sobre Inteligencia Artificial y Estadística (AISTATS 07)