El sistema de identificación digital automatizada (DAISY) es un sistema automatizado de identificación de especies optimizado para la detección rápida de invertebrados (por ejemplo, insectos) por parte de personas no expertas (por ejemplo, parataxónomos ).
Fue desarrollado por el Dr. Mark O'Neill a mediados de los años 1990. El desarrollo fue financiado por la Iniciativa Darwin en 1997 [1] y BBSRC . [2] Los derechos de propiedad intelectual fueron adquiridos por la empresa de O'Neill, Tumbling Dice Ltd, en febrero de 2000 [3] al final del Proyecto Darwin financiado con una subvención. El sistema experimentó un mayor desarrollo que dio como resultado la producción de un ejemplar que es accesible desde la web y que puede lidiar casi en tiempo real con grupos (por ejemplo, polillas halcón ) que contienen varios cientos de taxones . En hardware de servidor de PC de gama media a alta (por ejemplo, un servidor blade ) es posible una identificación en menos de un segundo para un grupo de 300 taxones. La paralelización de los códigos críticos del clasificador DAISY (usando tecnología FPGA a medida o tecnología de programación GPU de propósito general como CUDA ) dará un aumento de orden de magnitud en el rendimiento. Esto significa que DAISY se puede implementar para hacer identificaciones en tiempo real dentro de grupos que contienen miles de taxones (por ejemplo, moscas verdaderas ).
DAISY ha sido utilizado en varios proyectos de investigación por O'Neill [4] y otros, y ha aparecido en artículos de divulgación científica en revistas y programas de televisión. El proyecto también ha sido objeto de un artículo reciente en Science . [5]
En 2011, se instaló la primera instalación DAISY capaz de escalar a cientos de taxones en el Museo de Historia Natural de Londres. Este servidor ofrecía interfaces basadas en VNC y servicios web y podía descargar operaciones de comparación de patrones con uso intensivo de recursos informáticos en una GPU NVIDIA programada con CUDA . Esta instalación fue capaz de proporcionar identificación de especies a partir de un conjunto de datos de más de 300 taxones en menos de un segundo en un entorno de múltiples usuarios.
Más recientemente, bajo la égida de financiación de Innovate UK , DAISY ha sido ampliamente modificado para satisfacer las necesidades de las actividades upstream dentro del sector del petróleo y el gas, en particular la bioestratigrafía . El sistema resultante, GeoDAISY, representa un avance tecnológico significativo. Es capaz de aprendizaje profundo , encapsulamiento de conocimiento, minería de datos basada en patrones y búsqueda de contenido (basada en imágenes) , y puede manejar de manera eficiente conjuntos de entrenamiento que consisten en millones de patrones en hardware de productos básicos utilizando una combinación de almacenamiento inteligente de datos en caché y OpenMP . Más detalles de GeoDAISY y la justificación para su desarrollo están disponibles como documentos técnicos en la página de LinkedIn de Tumbling Dice.