Núcleo de Fisher

En la clasificación estadística , el núcleo de Fisher , llamado así por Ronald Fisher , es una función que mide la similitud de dos objetos basándose en conjuntos de mediciones para cada objeto y un modelo estadístico. En un procedimiento de clasificación, la clase de un nuevo objeto (cuya clase real es desconocida) se puede estimar minimizando, entre clases, un promedio de la distancia del núcleo de Fisher desde el nuevo objeto hasta cada miembro conocido de la clase dada.

El núcleo Fisher se introdujo en 1998. ^[1] Combina las ventajas de los modelos estadísticos generativos (como el modelo oculto de Markov ) y las de los métodos discriminativos (como las máquinas de vectores de soporte ):

Los modelos generativos pueden procesar datos de longitud variable (se admite la adición o eliminación de datos)
Los métodos discriminativos pueden tener criterios flexibles y producir mejores resultados.

Derivación

Puntuación de Fisher

El núcleo de Fisher utiliza la puntuación de Fisher , definida como

U_{X}=\nabla _{\theta }\log P(X|\theta )

donde θ es un conjunto (vector) de parámetros. La función que toma θ como log P( X | θ ) es la verosimilitud del modelo probabilístico.

Núcleo de Fisher

El núcleo de Fisher se define como

K(X_{i},X_{j})=U_{X_{i}}^{T}{\mathcal {I}}^{-1}U_{X_{j}}

siendo la matriz de información de Fisher . ${\mathcal {I}}$

Aplicaciones

Recuperación de información

El núcleo de Fisher es el núcleo de un modelo de probabilidad generativo. Como tal, constituye un puente entre los modelos generativos y probabilísticos de documentos. ^[2] Existen núcleos de Fisher para numerosos modelos, en particular tf–idf , ^[3] Naive Bayes y análisis semántico latente probabilístico .

Clasificación y recuperación de imágenes

El núcleo de Fisher también se puede aplicar a la representación de imágenes para problemas de clasificación o recuperación. Actualmente, la representación de bolsa de palabras visuales más popular adolece de escasez y alta dimensionalidad. El núcleo de Fisher puede dar como resultado una representación compacta y densa, que es más deseable para problemas de clasificación de imágenes ^[4] y recuperación ^[5]^[6] .

El vector de Fisher (FV), un caso especial, aproximado y mejorado del núcleo general de Fisher, ^[7] es una representación de imagen obtenida mediante la agrupación de características de imagen locales . La codificación FV almacena los vectores de desviación de covarianza y media por componente k del modelo de mezcla gaussiana (GMM) y cada elemento de los descriptores de características locales juntos. En una comparación sistemática, FV superó a todos los métodos de codificación comparados ( Bolsa de palabras visuales (BoW) , codificación de libro de códigos de núcleo (KCB), codificación lineal restringida por localidad (LLC), vector de descriptores agregados localmente (VLAD)) mostrando que la codificación de información de segundo orden (también conocida como covarianzas de palabras de código) de hecho beneficia el rendimiento de la clasificación. ^[8]

Véase también

Métrica de información de Fisher

Notas y referencias

^ Tommi Jaakola y David Haussler (1998), Explotación de modelos generativos en clasificadores discriminativos. En Advances in Neural Information Processing Systems 11 , páginas 487–493. MIT Press. ISBN 978-0-262-11245-1 PS, Citeseer
^ Cyril Goutte, Eric Gaussier, Nicola Cancedda, Hervé Dejean (2004)) "Enfoques generativos versus discriminativos para el reconocimiento de entidades a partir de datos con etiquetas deficientes" JADT 2004, 7èmes journées internationales analizan la estadística de données textuelles , Lovaina-la-Neuve, Bélgica, 10-12 de marzo de 2004
^ Charles Elkan (2005). Derivación de TF-IDF como núcleo de Fisher (PDF) . SPIRE. Archivado desde el original (PDF) el 20 de diciembre de 2013.
^ Florent Perronnin y Christopher Dance (2007), “Fisher Kernels sobre vocabularios visuales para la categorización de imágenes”
^ Herve Jegou et al. (2010), “Agregación de descriptores locales en una representación de imagen compacta”
^ AP Twinanda et al. (2014), “Recuperación de límites de tareas basada en el núcleo de Fisher en una base de datos laparoscópica con una única consulta de vídeo”
^ "VLFeat - Documentación > API C". www.vlfeat.org . Consultado el 4 de marzo de 2017 .
^ Seeland, Marco; Rzanny, Michael; Alaqraa, Nedal; Wäldchen, Jana; Mäder, Patrick (24 de febrero de 2017). "Clasificación de especies de plantas utilizando imágenes de flores: un estudio comparativo de representaciones de características locales". PLOS ONE . 12 (2): e0170629. doi : 10.1371/journal.pone.0170629 . ISSN 1932-6203. PMC 5325198 . PMID 28234999.

Nello Cristianini y John Shawe-Taylor. Introducción a las máquinas de vectores de soporte y otros métodos de aprendizaje basados en kernel . Cambridge University Press, 2000. ISBN 0-521-78019-5 ([1] Libro de SVM)