El análisis de contenido de video o analítica de contenido de video ( VCA ), también conocido como análisis de video o analítica de video ( VA ), es la capacidad de analizar video automáticamente para detectar y determinar eventos temporales y espaciales.
Esta capacidad técnica se utiliza en una amplia gama de dominios, incluidos el entretenimiento, [1] la recuperación y exploración de videos , [2] la atención médica, el comercio minorista, la automoción, el transporte, la automatización del hogar , la detección de llamas y humo, la seguridad y la protección. [3] Los algoritmos se pueden implementar como software en máquinas de uso general o como hardware en unidades de procesamiento de video especializadas.
Se pueden implementar muchas funcionalidades diferentes en VCA. La detección de movimiento por video es una de las formas más simples en las que se detecta movimiento con respecto a una escena de fondo fija. Las funcionalidades más avanzadas incluyen el seguimiento de video [4] y la estimación de egomotion [5] .
A partir de la representación interna que VCA genera en la máquina, es posible construir otras funcionalidades, como resumen de vídeo , [6] identificación , análisis de comportamiento u otras formas de conocimiento de la situación .
El VCA depende de una buena entrada de vídeo, por lo que a menudo se combina con tecnologías de mejora de vídeo, como eliminación de ruido de vídeo , estabilización de imagen , enmascaramiento de enfoque y súper resolución . [ cita requerida ]
Varios artículos proporcionan una descripción general de los módulos involucrados en el desarrollo de aplicaciones de análisis de video. [7] [8] Esta es una lista de funcionalidades conocidas y una breve descripción.
El VCA es una tecnología relativamente nueva, y numerosas empresas lanzaron productos mejorados con VCA a mediados de la década de 2000. [10] [11] [12] Si bien existen muchas aplicaciones, el historial de las diferentes soluciones de VCA difiere ampliamente. Las funcionalidades como la detección de movimiento , el conteo de personas y la detección de armas están disponibles como productos comerciales listos para usar y se cree que tienen un historial decente (por ejemplo, incluso el software gratuito como dsprobotics Flowstone puede manejar el análisis de movimiento y color). En respuesta a la pandemia de COVID-19 , muchos fabricantes de software han introducido nuevos análisis de salud pública como la detección de mascarillas o el seguimiento del distanciamiento social . [13] [14] [15]
En muchos dominios, el análisis de video se implementa en sistemas de CCTV , ya sea distribuido en las cámaras (en el borde) o centralizado en sistemas de procesamiento dedicados. Análisis de video y CCTV inteligente son términos comerciales para el análisis de video en el dominio de la seguridad. En el Reino Unido, la BSIA ha desarrollado una guía de introducción para el análisis de video en el dominio de la seguridad. [16] Además del análisis de video y para complementarlo, también se puede utilizar el análisis de audio. [17]
Los fabricantes de software de gestión de vídeo amplían constantemente la gama de módulos de análisis de vídeo disponibles. Con la nueva tecnología de seguimiento de sospechosos, es posible seguir fácilmente todos los movimientos de este sujeto: de dónde viene, cuándo, dónde y cómo se ha movido. Dentro de un sistema de vigilancia concreto, la tecnología de indexación es capaz de localizar a personas con características similares que se encontraban en el punto de visión de las cámaras durante un periodo de tiempo determinado. Normalmente, el sistema encuentra muchas personas diferentes con características similares y las presenta en forma de instantáneas. El operador sólo tiene que hacer clic en las imágenes y los sujetos que se deben seguir. En aproximadamente un minuto, es posible seguir todos los movimientos de una persona concreta e incluso crear un vídeo paso a paso de los movimientos.
Kinect es un periférico complementario para la consola de juegos Xbox 360 que utiliza VCA para parte de la entrada del usuario. [18]
En el sector minorista, el análisis de comportamiento de los consumidores (VCA) se utiliza para hacer un seguimiento de los compradores dentro de la tienda. [19] De esta manera, se puede obtener un mapa de calor de la tienda, lo que resulta beneficioso para el diseño de la tienda y las optimizaciones de marketing. Otras aplicaciones incluyen el tiempo de permanencia al mirar un producto y la detección de artículos retirados o abandonados.
La calidad del VCA en el entorno comercial es difícil de determinar. Depende de muchas variables, como el caso de uso , la implementación , la configuración del sistema y la plataforma informática . Los métodos típicos para obtener una idea objetiva de la calidad en entornos comerciales incluyen la evaluación comparativa independiente [20] y las ubicaciones de prueba designadas.
El VCA se ha utilizado para fines de gestión de multitudes , especialmente en el O2 Arena de Londres y en el London Eye .
La policía y los científicos forenses analizan los videos de CCTV cuando investigan actividades delictivas. La policía utiliza software, como Kinesense , que realiza un análisis del contenido de video para buscar eventos clave en el video y encontrar sospechosos. Las encuestas han demostrado que hasta el 75% de los casos involucran CCTV. La policía utiliza software de análisis de contenido de video para buscar videos largos de eventos importantes. [21] [22]
El análisis de contenido de video es un subconjunto de la visión artificial y, por lo tanto, de la inteligencia artificial . Dos importantes iniciativas de referencia académica son TRECVID [23] , que utiliza una pequeña parte de las secuencias de video de i-LIDS, y los datos de referencia PETS [24] . Se centran en funcionalidades como el seguimiento, la detección de equipaje olvidado y el cercado virtual. Los conjuntos de datos de video de referencia como el UCF101 [25] permiten investigaciones de reconocimiento de acciones que incorporan atención visual temporal y espacial con red neuronal convolucional y memoria a corto plazo . El software de análisis de video también se está combinando con secuencias de cámaras corporales y de tablero de instrumentos para redactar más fácilmente las secuencias para su divulgación pública e identificar eventos y personas en los videos. [26]
La UE está financiando un proyecto del 7PM llamado P-REACT [27] para integrar análisis de contenido de vídeo en sistemas integrados con bases de datos de seguridad policial y del transporte. [28]
La inteligencia artificial para la videovigilancia utiliza programas informáticos que analizan el audio y las imágenes de las cámaras de videovigilancia para reconocer personas, vehículos, objetos y eventos. El programa de los contratistas de seguridad es el software que define las áreas restringidas dentro del campo de visión de la cámara (como un área cercada, un estacionamiento pero no la acera o la calle pública fuera del estacionamiento) y programa los horarios del día (como después del cierre de negocios) para la propiedad que está siendo protegida por la vigilancia de la cámara . La inteligencia artificial ("IA") envía una alerta si detecta a un intruso que infringe la "regla" establecida de que no se permite a ninguna persona ingresar a esa área durante ese momento del día.