stringtranslate.com

Contar boceto

Count sketch es un tipo de reducción de dimensionalidad que es particularmente eficiente en estadística , aprendizaje automático y algoritmos . [1] [2] Fue inventado por Moses Charikar, Kevin Chen y Martin Farach-Colton [3] en un esfuerzo por acelerar el AMS Sketch de Alon, Matias y Szegedy para aproximar los momentos de frecuencia de las corrientes [4] (estos los cálculos requieren contar el número de apariciones de los distintos elementos de la corriente).

El boceto es casi idéntico [ cita necesaria ] al algoritmo hash de características de John Moody, [5] pero difiere en el uso de funciones hash con baja dependencia, lo que lo hace más práctico. Para seguir teniendo una alta probabilidad de éxito, se utiliza el truco de la mediana para agregar múltiples bocetos de conteo, en lugar de la media.

Estas propiedades permiten el uso de métodos de kernel explícitos , agrupación bilineal en redes neuronales y son la piedra angular de muchos algoritmos de álgebra lineal numérica. [6]

Explicación intuitiva

Los inventores de esta estructura de datos ofrecen la siguiente explicación iterativa de su funcionamiento: [3]

Definición matemática

1. Para las constantes y (que se definirán más adelante), elija de forma independiente funciones hash aleatorias y tales que y . Es necesario que las familias de hash de las que se eligen y sean independientes por pares.

2. Para cada elemento de la secuencia, agréguelo al enésimo depósito del enésimo hash.

Al final de este proceso, se tienen sumas donde

Para estimar el recuento de s se calcula el siguiente valor:

Los valores son estimaciones imparciales de cuántas veces ha aparecido en la transmisión.

La estimación tiene varianza , donde es la longitud del arroyo y es . [7]

Además, se garantiza que nunca estará más que alejado del valor real, con una probabilidad de .

formulación vectorial

Alternativamente, Count-Sketch puede verse como un mapeo lineal con una función de reconstrucción no lineal. Sea , una colección de matrices, definida por

para y 0 en cualquier otro lugar.

Luego se dibuja un vector mediante . Para reconstruir tomamos . Esto da las mismas garantías que las expuestas anteriormente, si tomamos y .

Relación con el boceto tensorial

La proyección del croquis de conteo del producto exterior de dos vectores es equivalente a la convolución de los croquis de conteo de dos componentes.

El boceto de conteo calcula una convolución vectorial

, donde y son matrices de croquis de recuento independientes.

Pham y Pagh [8] muestran que esto es igual a : un esquema de conteo del producto exterior de vectores, donde denota el producto de Kronecker .

La transformada rápida de Fourier se puede utilizar para realizar una convolución rápida de bocetos de recuento. Al utilizar el producto de división de caras [9] [10] [11], tales estructuras se pueden calcular mucho más rápido que las matrices normales.

Ver también

Referencias

  1. ^ Faisal M. Algashaam; Kien Nguyen; Mohamed Alkanhal; Vinod Chandran; Wageeh Boles. "Clasificación periocular multiespectral con agrupación multimodal compacta multilineal" [1]. Acceso IEEE , vol. 5. 2017.
  2. ^ Ahlé, Thomas; Knudsen, Jakob (3 de septiembre de 2019). "Bosquejo tensorial casi óptimo". Puerta de la investigación . Consultado el 11 de julio de 2020 .
  3. ^ ab Charikar, Chen y Farach-Colton 2004.
  4. ^ Alon, Noga, Yossi Matías y Mario Szegedy. "La complejidad espacial de aproximar los momentos de frecuencia". Revista de Ciencias de la Computación y de Sistemas 58.1 (1999): 137-147.
  5. ^ De mal humor, John. "Aprendizaje rápido en jerarquías de resolución múltiple". Avances en los sistemas de procesamiento de información neuronal. 1989.
  6. ^ Woodruff, David P. "Dibujar como herramienta de álgebra lineal numérica". Informática teórica 10.1-2 (2014): 1–157.
  7. ^ Larsen, Kasper Green, Rasmus Pagh y Jakub Tětek. "CountSketches, hash de funciones y la mediana de tres". Congreso Internacional sobre Aprendizaje Automático. PMLR, 2021.
  8. ^ Ninh, Pham; Pagh, Rasmus (2013). Núcleos polinómicos rápidos y escalables a través de mapas de características explícitos . Conferencia internacional SIGKDD sobre descubrimiento de conocimiento y minería de datos. Asociación para Maquinaria de Computación. doi :10.1145/2487575.2487591.
  9. ^ Slyusar, VI (1998). «Productos finales en matrices en aplicaciones de radar» (PDF) . Radioelectrónica y Sistemas de Comunicaciones . 41 (3): 50–53.
  10. ^ Slyusar, VI (20 de mayo de 1997). "Modelo analítico del conjunto de antenas digitales sobre la base de productos matriciales de división de caras" (PDF) . Proc. ICATT-97, Kiev : 108–109.
  11. ^ Slyusar, VI (13 de marzo de 1998). "Una familia de productos faciales de matrices y sus propiedades" (PDF) . Cibernética y Análisis de Sistemas C/C de Kibernetika I Sistemnyi Analiz.- 1999 . 35 (3): 379–384. doi :10.1007/BF02733426. S2CID  119661450.

Otras lecturas