El análisis de contenido de video o análisis de contenido de video ( VCA ), también conocido como análisis de video o análisis de video ( VA ), es la capacidad de analizar video automáticamente para detectar y determinar eventos temporales y espaciales.
Esta capacidad técnica se utiliza en una amplia gama de dominios que incluyen entretenimiento, [1] recuperación y navegación de videos , [2] atención médica, comercio minorista, automoción, transporte, automatización del hogar , detección de llamas y humo, seguridad y protección. [3] Los algoritmos pueden implementarse como software en máquinas de uso general o como hardware en unidades de procesamiento de video especializadas.
Se pueden implementar muchas funcionalidades diferentes en VCA. La detección de movimiento por vídeo es una de las formas más sencillas de detectar movimiento con respecto a una escena de fondo fija. Las funcionalidades más avanzadas incluyen seguimiento de vídeo [4] y estimación de egomotion . [5]
A partir de la representación interna que genera VCA en la máquina, es posible construir otras funcionalidades, como resumen de vídeo , [6] identificación , análisis de comportamiento u otras formas de conocimiento de la situación .
VCA depende de una buena entrada de vídeo, por lo que a menudo se combina con tecnologías de mejora de vídeo como eliminación de ruido de vídeo , estabilización de imagen , enmascaramiento de nitidez y superresolución . [ cita necesaria ]
Varios artículos proporcionan una descripción general de los módulos involucrados en el desarrollo de aplicaciones de análisis de video. [7] [8] Esta es una lista de funcionalidades conocidas y una breve descripción.
VCA es una tecnología relativamente nueva; numerosas empresas lanzaron productos mejorados con VCA a mediados de la década de 2000. [10] [11] [12] Si bien existen muchas aplicaciones, el historial de las diferentes soluciones VCA difiere ampliamente. Funcionalidades como la detección de movimiento , el conteo de personas y la detección de armas están disponibles como productos comerciales listos para usar y se cree que tienen un historial decente (por ejemplo, incluso el software gratuito como dsprobotics Flowstone puede manejar análisis de movimiento y color). En respuesta a la pandemia de COVID-19 , muchos fabricantes de software han introducido nuevos análisis de salud pública, como la detección de mascarillas o el seguimiento del distanciamiento social . [13] [14] [15]
En muchos dominios, VCA se implementa en sistemas CCTV , ya sea distribuido en las cámaras (en el borde) o centralizado en sistemas de procesamiento dedicados. Video Analytics y Smart CCTV son términos comerciales para VCA en el ámbito de la seguridad. En el Reino Unido, la BSIA ha desarrollado una guía de introducción al VCA en el ámbito de la seguridad. [16] Además de la analítica de vídeo y para complementarla, también se puede utilizar la analítica de audio. [17]
Los fabricantes de software de gestión de vídeo amplían constantemente la gama de módulos de análisis de vídeo disponibles. Con la nueva tecnología de seguimiento de sospechosos, es posible rastrear fácilmente todos los movimientos de este sujeto: de dónde vinieron, cuándo, dónde y cómo se movieron. Dentro de un sistema de vigilancia particular, la tecnología de indexación es capaz de localizar personas con características similares que estuvieron dentro de los puntos de vista de las cámaras durante o dentro de un período de tiempo específico. Normalmente, el sistema encuentra muchas personas diferentes con características similares y las presenta en forma de instantáneas. El operador sólo necesita hacer clic en aquellas imágenes y sujetos que necesitan ser rastreados. En aproximadamente un minuto, es posible seguir todos los movimientos de una persona en particular, e incluso crear un vídeo paso a paso de los movimientos.
Kinect es un periférico complementario para la consola de juegos Xbox 360 que utiliza VCA para parte de la entrada del usuario. [18]
En la industria minorista, VCA se utiliza para rastrear a los compradores dentro de la tienda. [19] De esta manera, se puede obtener un mapa de calor de la tienda, lo que es beneficioso para el diseño de la tienda y las optimizaciones de marketing. Otras aplicaciones incluyen el tiempo de permanencia al mirar un producto y la detección de artículos eliminados o abandonados.
La calidad del VCA en el ámbito comercial es difícil de determinar. Depende de muchas variables como el caso de uso , la implementación , la configuración del sistema y la plataforma informática . Los métodos típicos para tener una idea objetiva de la calidad en entornos comerciales incluyen evaluaciones comparativas independientes [20] y ubicaciones de prueba designadas.
VCA se ha utilizado con fines de gestión de multitudes , especialmente en el O2 Arena de Londres y en el London Eye .
La policía y los científicos forenses analizan los vídeos de CCTV cuando investigan actividades delictivas. La policía utiliza software, como Kinesense , que realiza análisis de contenido de vídeo para buscar eventos clave en vídeo y encontrar sospechosos. Las encuestas han demostrado que hasta el 75% de los casos involucran CCTV. La policía utiliza software de análisis de contenido de vídeo para buscar vídeos largos de eventos importantes. [21] [22]
El análisis de contenido de vídeo es un subconjunto de la visión por computadora y, por tanto, de la inteligencia artificial . Dos importantes iniciativas de referencia académica son TRECVID, [23] que utiliza una pequeña parte del metraje de vídeo i-LIDS, y PETS Benchmark Data. [24] Se centran en funcionalidades como el seguimiento, la detección de equipaje dejado y la valla virtual. Los conjuntos de datos de vídeo de referencia, como el UCF101 [25], permiten investigaciones de reconocimiento de acciones que incorporan atención visual temporal y espacial con redes neuronales convolucionales y memoria a corto plazo . El software de análisis de video también se está combinando con imágenes de cámaras corporales y de tablero para redactar más fácilmente las imágenes para su divulgación pública e identificar eventos y personas en los videos. [26]
La UE está financiando un proyecto del 7PM llamado P-REACT [27] para integrar análisis de contenido de vídeo en sistemas integrados con bases de datos de seguridad de la policía y el transporte. [28]
La inteligencia artificial para videovigilancia utiliza programas de software que analizan el audio y las imágenes de las cámaras de videovigilancia para reconocer personas, vehículos, objetos y eventos. El programa de contratistas de seguridad es el software para definir áreas restringidas dentro de la vista de la cámara (como un área cercada, un estacionamiento pero no la acera o la calle pública fuera del estacionamiento) y programar para momentos del día (como después del cierre del negocio). ) para la propiedad protegida por la cámara de vigilancia . La inteligencia artificial ("IA") envía una alerta si detecta que un intruso infringe la "regla" establecida de que no se permite a ninguna persona entrar en esa zona durante esa hora del día.