stringtranslate.com

Árbol de cubierta

El árbol de cobertura es un tipo de estructura de datos en informática que está específicamente diseñada para facilitar la aceleración de una búsqueda del vecino más cercano . Es un refinamiento de la estructura de datos de Navigating Net y está relacionada con una variedad de otras estructuras de datos desarrolladas para indexar datos intrínsecamente de baja dimensión. [1]

El árbol puede considerarse como una jerarquía de niveles, en la que el nivel superior contiene el punto raíz y el nivel inferior contiene todos los puntos del espacio métrico. Cada nivel C está asociado a un valor entero i que disminuye en uno a medida que se desciende por el árbol. Cada nivel C del árbol de cobertura tiene tres propiedades importantes:

Complejidad

Encontrar

Al igual que otros árboles métricos, el árbol de cobertura permite búsquedas de vecinos más cercanos en donde es una constante asociada con la dimensionalidad del conjunto de datos y n es la cardinalidad. Para comparar, una búsqueda lineal básica requiere , que es una dependencia mucho peor de . Sin embargo, en espacios métricos de alta dimensión , la constante no es trivial, lo que significa que no se puede ignorar en el análisis de complejidad. A diferencia de otros árboles métricos, el árbol de cobertura tiene un límite teórico en su constante que se basa en la constante de expansión del conjunto de datos o la constante de duplicación (en el caso de la recuperación de NN aproximada). El límite en el tiempo de búsqueda es donde es la constante de expansión del conjunto de datos.

Insertar

Aunque los árboles de cobertura proporcionan búsquedas más rápidas que el enfoque ingenuo, esta ventaja debe sopesarse con el costo adicional de mantener la estructura de datos. En un enfoque ingenuo, agregar un nuevo punto al conjunto de datos es trivial porque no es necesario preservar el orden, pero en un árbol de cobertura puede llevar tiempo. Sin embargo, este es un límite superior y se han implementado algunas técnicas que parecen mejorar el rendimiento en la práctica. [2]

Espacio

El árbol de cobertura utiliza una representación implícita para realizar un seguimiento de los puntos repetidos, por lo que solo requiere espacio O(n).

Véase también

Referencias

Notas
  1. ^ Kenneth Clarkson. Búsqueda de vecinos más próximos y dimensiones del espacio métrico. En G. Shakhnarovich, T. Darrell y P. Indyk , editores, Métodos de vecinos más próximos para el aprendizaje y la visión: teoría y práctica, páginas 15--59. MIT Press, 2006.
  2. ^ "Árbol de portada".
Bibliografía