Inteligencia artificial para videovigilancia

La inteligencia artificial para videovigilancia utiliza programas de software que analizan el audio y las imágenes de las cámaras de videovigilancia para reconocer personas, vehículos, objetos, atributos y eventos. Los contratistas de seguridad programan el software para definir áreas restringidas dentro de la vista de la cámara (como un área cercada, un estacionamiento pero no la acera o la calle pública fuera del estacionamiento) y programar para horas del día (como después del cierre del negocio). para que la propiedad esté protegida por la cámara de vigilancia . La inteligencia artificial ("IA") envía una alerta si detecta que un intruso infringe la "regla" establecida de que no se permite a ninguna persona entrar en esa zona durante esa hora del día. ^[1]

El programa de IA funciona mediante el uso de visión artificial . La visión artificial es una serie de algoritmos , o procedimientos matemáticos, que funcionan como un diagrama de flujo o una serie de preguntas para comparar el objeto visto con cientos de miles de imágenes de referencia almacenadas de humanos en diferentes posturas, ángulos, posiciones y movimientos. La IA se pregunta si el objeto observado se mueve como en las imágenes de referencia, si tiene aproximadamente el mismo tamaño de alto que de ancho, si tiene los característicos dos brazos y dos piernas, si se mueve con velocidad similar y si en cambio es vertical. de horizontales. Son posibles muchas otras preguntas, como el grado en que el objeto es reflectante, el grado en que es estable o vibra y la suavidad con la que se mueve. Combinando todos los valores de las distintas preguntas, se deriva una clasificación general que le da a la IA la probabilidad de que el objeto sea o no un humano. Si el valor excede un límite establecido, se envía la alerta. Es característico de estos programas que, hasta cierto punto, aprenden por sí solos , aprendiendo, por ejemplo, que los seres humanos o los vehículos aparecen más grandes en ciertas partes de la imagen monitoreada (las áreas cercanas a la cámara) que en otras partes, siendo esas las áreas más alejadas. desde la cámara.

Además de la regla simple que restringe la entrada de personas o vehículos a ciertas áreas a ciertas horas del día, se pueden establecer reglas más complejas. Es posible que el usuario del sistema desee saber si los vehículos circulan en una dirección pero no en la otra. Es posible que los usuarios deseen saber que hay más de un cierto número preestablecido de personas dentro de un área en particular. La IA es capaz de mantener la vigilancia de cientos de cámaras simultáneamente. Su capacidad para detectar a un intruso en la distancia o bajo la lluvia o el resplandor es superior a la capacidad de los humanos para hacerlo.

Este tipo de IA para seguridad se conoce como " basada en reglas " porque un programador humano debe establecer reglas para todas las cosas sobre las cuales el usuario desea recibir alertas. Esta es la forma más frecuente de IA para la seguridad. Muchos sistemas de cámaras de videovigilancia actuales incluyen este tipo de capacidad de IA. El disco duro que alberga el programa puede estar ubicado en las propias cámaras o en un dispositivo separado que recibe la entrada de las cámaras.

Se ha desarrollado una forma más nueva de IA para la seguridad, no basada en reglas, llamada " análisis de comportamiento ". Este software es completamente de autoaprendizaje sin necesidad de programación inicial por parte del usuario o contratista de seguridad. En este tipo de análisis , la IA aprende cuál es el comportamiento normal de las personas, los vehículos, las máquinas y el entorno a partir de su propia observación de patrones de diversas características como tamaño, velocidad, reflectividad, color, agrupación, orientación vertical u horizontal y y así sucesivamente. La IA normaliza los datos visuales, lo que significa que clasifica y etiqueta los objetos y patrones que observa, creando definiciones continuamente refinadas de lo que es un comportamiento normal o promedio para los distintos objetos observados. Después de varias semanas de aprender de esta manera, puede reconocer cuándo las cosas rompen el patrón. Cuando observa tales anomalías envía una alerta. Por ejemplo, es normal que circulen coches por la calle. Un automóvil visto subiendo a una acera sería una anomalía. Si un patio cercado normalmente está vacío por la noche, entonces una persona que ingrese a esa área sería una anomalía.

Historia

Planteamiento del problema

Las limitaciones en la capacidad de los humanos para monitorear atentamente imágenes de videovigilancia en vivo llevaron a la demanda de inteligencia artificial que pudiera cumplir mejor la tarea. Los seres humanos que miran un único monitor de vídeo durante más de veinte minutos pierden el 95% de su capacidad para mantener la atención suficiente para discernir acontecimientos importantes. ^[2] Con dos monitores esto se reduce nuevamente a la mitad. ^[3] Dado que muchas instalaciones tienen docenas o incluso cientos de cámaras, la tarea está claramente más allá de la capacidad humana. En general, las imágenes de las cámaras de pasillos vacíos, almacenes, aparcamientos o estructuras son extremadamente aburridas y, por lo tanto, la atención se debilita rápidamente. Cuando se monitorean varias cámaras, generalmente empleando un monitor de pared o un grupo de monitores con vistas de pantalla dividida y rotando cada varios segundos entre un conjunto de cámaras y el siguiente, el tedio visual rápidamente se vuelve abrumador. Si bien las cámaras de videovigilancia proliferaron con gran adopción por parte de usuarios que iban desde concesionarios de automóviles y plazas comerciales hasta escuelas y empresas e instalaciones altamente seguras como plantas nucleares, en retrospectiva se reconoció que la videovigilancia realizada por agentes humanos (también llamados "operadores") no era práctica. e ineficaz. Los amplios sistemas de videovigilancia quedaron relegados a meras grabaciones para un posible uso forense para identificar a alguien, tras un robo, un incendio, un ataque o un incidente. Cuando se emplearon vistas de cámara de gran angular, especialmente en grandes áreas al aire libre, se descubrieron graves limitaciones incluso para este propósito debido a una resolución insuficiente. ^[4] En estos casos es imposible identificar al intruso o perpetrador porque su imagen es demasiado pequeña en el monitor. ^{[ cita necesaria ]}

Intentos anteriores de solución

Cámaras de detección de movimiento.

En respuesta a las deficiencias de los guardias humanos para vigilar los monitores de vigilancia durante mucho tiempo, la primera solución fue agregar detectores de movimiento a las cámaras. Se razonó que el movimiento de un intruso o perpetrador enviaría una alerta al oficial de monitoreo remoto, obviando la necesidad de una vigilancia humana constante. El problema era que en un entorno exterior hay un movimiento constante o cambios de píxeles que componen la imagen total vista en la pantalla. El movimiento de las hojas de los árboles movidas por el viento, la basura en el suelo, los insectos, los pájaros, los perros, las sombras, los faros, los rayos del sol, etc., todos comprenden movimiento. Esto provocó cientos o incluso miles de alertas falsas por día, lo que hizo que esta solución fuera inoperable, excepto en ambientes interiores durante las horas de no funcionamiento.

Detección de movimiento por vídeo avanzada

La siguiente evolución redujo las alertas falsas hasta cierto punto, pero a costa de una calibración manual complicada y que requiere mucho tiempo. Aquí se detectan cambios de un objetivo, como una persona o un vehículo, en relación con un fondo fijo. Cuando el fondo cambia estacionalmente o debido a otros cambios, la confiabilidad se deteriora con el tiempo. La economía de responder a demasiadas alertas falsas volvió a demostrar ser un obstáculo y esta solución no fue suficiente.

Advenimiento del verdadero análisis de vídeo

El aprendizaje automático del reconocimiento visual se relaciona con patrones y su clasificación. ^[5]^[6] El verdadero análisis de vídeo puede distinguir la forma humana, vehículos y barcos u objetos seleccionados del movimiento general de todos los demás objetos y la estática visual o los cambios en los píxeles del monitor. Lo hace reconociendo patrones . Cuando el objeto de interés, por ejemplo un ser humano, viola una regla preestablecida, por ejemplo que el número de personas no excederá cero en un área predefinida durante un intervalo de tiempo definido, se envía una alerta. Un rectángulo rojo o el llamado "cuadro delimitador" normalmente seguirá automáticamente al intruso detectado, y se envía un breve videoclip de esto como alerta.

Aplicación práctica

Acción preventiva en tiempo real

La detección de intrusos mediante videovigilancia tiene limitaciones basadas en la economía y la naturaleza de las cámaras de vídeo. Por lo general, las cámaras para exteriores están configuradas para una vista de gran angular y, sin embargo, miran a una gran distancia. La velocidad de fotogramas por segundo y el rango dinámico para manejar áreas con mucha y poca luz desafían aún más a la cámara a ser adecuada para ver a un intruso humano en movimiento. Por la noche, incluso en áreas exteriores iluminadas, un sujeto en movimiento no capta suficiente luz por fotograma por segundo y, por lo tanto, a menos que esté muy cerca de la cámara, aparecerá como una delgada brizna, un fantasma apenas perceptible o completamente invisible. Las condiciones de deslumbramiento, oscurecimiento parcial, lluvia, nieve, niebla y oscuridad agravan el problema. Incluso cuando se dirige a un ser humano para que mire la ubicación real en un monitor de un sujeto en estas condiciones, el sujeto generalmente no será detectado. La IA es capaz de observar imparcialmente la imagen completa y las imágenes de todas las cámaras simultáneamente. Utilizando modelos estadísticos de grados de desviación de su patrón aprendido de lo que constituye la forma humana, detectará un intruso con alta confiabilidad y una baja tasa de falsas alertas incluso en condiciones adversas. ^[7] Su aprendizaje se basa en aproximadamente un cuarto de millón de imágenes de humanos en diversas posiciones, ángulos, posturas, etc.

Una cámara de un megapíxel con análisis de vídeo integrado pudo detectar a una persona a una distancia de unos 350 pies y un ángulo de visión de unos 30 grados en condiciones no ideales. Se podrían establecer reglas para una "cerca virtual" o una intrusión en un área predefinida. Se podrían establecer reglas para el desplazamiento direccional, los objetos dejados atrás, la formación de multitudes y algunas otras condiciones. La inteligencia artificial para videovigilancia se utiliza ampliamente en China. Véase Vigilancia masiva en China .

Hablar abajo

Una de las características más poderosas del sistema es que un oficial u operador humano, al recibir una alerta de la IA, podría hablar inmediatamente con el intruso a través de parlantes públicos exteriores. Esto tenía un alto valor disuasivo, ya que la mayoría de los delitos son oportunistas y el riesgo de captura para el intruso se vuelve tan pronunciado cuando una persona viva le habla que es muy probable que desista de la intrusión y se retire. El oficial de seguridad describiría las acciones del intruso para que no tuviera dudas de que una persona real lo estaba observando. El oficial anunciaría que el intruso estaba infringiendo la ley y que se estaba contactando a las autoridades y que estaban siendo grabados en video. ^[8]

Informe de incumplimiento verificado

La policía recibe una enorme cantidad de falsas alarmas de alarmas antirrobo. De hecho, la industria de la seguridad informa que más del 98% de estas alarmas son falsas. En consecuencia, la policía da muy baja prioridad a las alarmas antirrobo y puede tardar entre veinte minutos y dos horas en llegar al lugar. Por el contrario, el delito detectado mediante análisis de vídeo se informa al oficial de seguimiento central, quien verifica con sus propios ojos que se trata de un delito real en curso. Luego envía a la policía, que da a dichas llamadas su máxima prioridad.

Análisis de comportamiento

Entornos activos

Si bien el análisis de vídeo basado en reglas funcionó de manera económica y confiable para muchas aplicaciones de seguridad, hay muchas situaciones en las que no puede funcionar. ^[9] Para un área interior o exterior donde nadie pertenece durante ciertos momentos del día, por ejemplo durante la noche, o para áreas donde nadie pertenece en ningún momento, como una torre de telefonía celular , los análisis tradicionales basados en reglas son perfectamente apropiados. En el ejemplo de una torre de telefonía celular, el raro momento en que un técnico de servicio pueda necesitar acceder al área simplemente requeriría llamar con un código de acceso para poner la respuesta de monitoreo "en prueba" o desactivarla durante el breve tiempo que la persona autorizada estuvo allí. .

Pero existen muchas necesidades de seguridad en entornos activos en los que cientos o miles de personas están en todas partes todo el tiempo. Por ejemplo, un campus universitario, una fábrica activa, un hospital o cualquier instalación operativa activa. No es posible establecer reglas que discriminen entre personas legítimas y delincuentes o malhechores.

Superar el problema de los entornos activos

Utilizando análisis de comportamiento, una IA de autoaprendizaje y no basada en reglas toma los datos de las cámaras de video y clasifica continuamente los objetos y eventos que ve. Por ejemplo, una persona que cruza una calle es una clasificación. Un grupo de personas es otra clasificación. Un vehículo es una clasificación, pero con el aprendizaje continuo se discriminaría un autobús público de un camión pequeño y de una motocicleta. Cada vez más sofisticado, el sistema reconoce patrones en el comportamiento humano. Por ejemplo, podría observar que las personas pasan a través de una puerta de acceso controlado de una en una. La puerta se abre, la persona presenta su tarjeta o tag de proximidad, la persona pasa y la puerta se cierra. Este patrón de actividad, observado repetidamente, forma la base de lo que es normal en la visión de la cámara que observa esa escena. Ahora bien, si una persona autorizada abre la puerta pero una segunda persona no autorizada "que sigue de cerca" agarra la puerta antes de que se cierre y pase, ese es el tipo de anomalía que crearía una alerta. Este tipo de análisis es mucho más complejo que el análisis basado en reglas. Mientras que el análisis basado en reglas funciona principalmente para detectar intrusos en áreas donde normalmente no hay nadie presente en momentos definidos del día, el análisis de comportamiento funciona donde las personas están activas para detectar cosas que están fuera de lo común.

Un incendio que se produjera al aire libre sería un evento inusual y provocaría una alerta, al igual que una nube de humo ascendente. Los vehículos que conducen en sentido contrario en un camino de sentido único también tipificarían el tipo de evento que tiene una fuerte firma visual y se desviaría del patrón observado repetidamente de vehículos que conducen en el sentido único correcto en el carril. Que un atacante arrojara al suelo sería un evento inusual que probablemente provocaría una alerta. Esto es específico de la situación. Entonces, si la cámara viera un gimnasio donde se practica lucha libre, la IA aprendería que es habitual que un humano arroje a otro al suelo, en cuyo caso no alertaría sobre esta observación.

Lo que la inteligencia artificial 'entiende'

La IA no sabe ni comprende qué es un humano, un incendio o un vehículo. Se trata simplemente de encontrar características de estas cosas en función de su tamaño, forma, color, reflectividad, ángulo, orientación, movimiento, etc. Luego descubre que los objetos que ha clasificado tienen patrones típicos de comportamiento. Por ejemplo, los humanos caminan por las aceras y, a veces, por las calles, pero no trepan muy a menudo por las paredes de los edificios. Los vehículos circulan por las calles pero no por las aceras. Así, el comportamiento anómalo de alguien que sube a un edificio o de un vehículo que se desvía hacia una acera desencadenaría una alerta.

Varía de la mentalidad tradicional de los sistemas de seguridad.

Los sistemas de alarma típicos están diseñados para no pasar por alto los verdaderos positivos (eventos delictivos reales) y para tener una tasa de falsas alarmas lo más baja posible. En ese sentido, las alarmas antirrobo pasan por alto muy pocos aspectos positivos verdaderos, pero tienen una tasa muy alta de falsas alarmas incluso en ambientes interiores controlados. Las cámaras de detección de movimiento pasan por alto algunos verdaderos aspectos positivos, pero están plagadas de abrumadoras falsas alarmas en un ambiente al aire libre. Los análisis basados en reglas detectan de manera confiable la mayoría de los verdaderos positivos y tienen una baja tasa de falsos positivos, pero no pueden funcionar en entornos activos, solo en entornos vacíos. También se limitan a la simple discriminación de si hay un intruso presente o no.

Algo tan complejo o sutil como el estallido de una pelea o que un empleado infrinja un procedimiento de seguridad no es posible que un análisis basado en reglas lo detecte o discrimine. Con el análisis del comportamiento, lo es. Los lugares donde la gente se mueve y trabaja no presentan ningún problema. Sin embargo, la IA puede detectar muchas cosas que parecen anómalas pero que son de naturaleza inocente. Por ejemplo, si los estudiantes de un campus caminan por una plaza, eso se aprenderá con normalidad. Si un par de estudiantes decidieran llevar una sábana grande al aire libre ondeando al viento, eso podría disparar una alerta. Se alertaría al oficial de monitoreo para que mirara su monitor y vería que el evento no es una amenaza y luego lo ignoraría. El grado de desviación de la norma que desencadena una alerta se puede establecer de modo que sólo se informen las cosas más anormales. Sin embargo, esto sigue constituyendo una nueva forma de interacción entre humanos y la IA que no está representada por la mentalidad tradicional de la industria de las alarmas. Esto se debe a que habrá muchas falsas alarmas que, no obstante, puede ser valioso enviar a un oficial humano que pueda mirar rápidamente y determinar si la escena requiere una respuesta. En este sentido, es un "toque en el hombro" de la IA para que el humano mire algo.

Limitaciones del análisis de comportamiento

Debido a que se procesan continuamente tantas cosas complejas, el software realiza muestreos a una resolución muy baja de solo 1 CIF para conservar la demanda computacional. La resolución 1 CIF significa que un objeto del tamaño de un humano no será detectado si la cámara utilizada es gran angular y el humano está a más de sesenta a ochenta pies de distancia, dependiendo de las condiciones. Objetos más grandes, como vehículos o humo, serían detectables a mayores distancias.

Cuantificación de la conciencia situacional.

La utilidad de la inteligencia artificial para la seguridad no existe en el vacío y su desarrollo no fue impulsado por estudios puramente académicos o científicos. Más bien, está dirigido a las necesidades del mundo real y, por tanto, a las fuerzas económicas. Su uso para aplicaciones no relacionadas con la seguridad, como la eficiencia operativa, el mapeo de calor de los compradores en las áreas de exhibición (es decir, cuántas personas hay en un área determinada en el espacio comercial) y la asistencia a clases, están en desarrollo. ^[10] Los humanos no están tan bien calificados como la IA para compilar y reconocer patrones que consisten en conjuntos de datos muy grandes que requieren cálculos simultáneos en múltiples ubicaciones vistas remotamente. No hay nada innatamente humano en esa conciencia. Se ha demostrado que esta multitarea desenfoca la atención y el desempeño humanos. Las IA tienen la capacidad de manejar dichos datos. A efectos de seguridad, al interactuar con las cámaras de vídeo, funcionalmente tienen mejor agudeza visual que los humanos o la aproximación de las máquinas. Para juzgar las sutilezas de los comportamientos o intenciones de los sujetos o los grados de amenaza, los humanos siguen siendo muy superiores en el estado actual de la tecnología. Por lo tanto, la IA en seguridad funciona para escanear ampliamente más allá de la capacidad humana y examinar los datos hasta un primer nivel de clasificación de relevancia y alertar al oficial humano que luego asume la función de evaluación y respuesta.

La seguridad en el mundo práctico está determinada económicamente de modo que el gasto en seguridad preventiva nunca excederá el costo percibido del riesgo a evitar. Los estudios han demostrado que las empresas normalmente sólo gastan alrededor de una vigésima quinta parte de la cantidad en seguridad que les costaron sus pérdidas reales. ^[11] Lo que según la teoría económica pura debería ser una equivalencia u homeostasis, queda muy lejos de serlo. Una teoría que explica esto es la disonancia cognitiva , o la facilidad con la que cosas desagradables como el riesgo pueden ser desviadas de la mente consciente. Sin embargo, la seguridad es un gasto importante y la comparación de los costos de diferentes medios de seguridad es siempre lo más importante entre los profesionales de la seguridad.

Otra razón por la que se subestiman las amenazas o pérdidas futuras a la seguridad es que a menudo sólo se considera el costo directo de una pérdida potencial en lugar del espectro de pérdidas consecuentes que se experimentan concomitantemente. Por ejemplo, la destrucción por vandalismo de una máquina de producción personalizada en una fábrica o de un camión con remolque refrigerado daría como resultado un largo tiempo de reemplazo durante el cual los clientes no podrían ser atendidos, lo que resultaría en la pérdida de su negocio. Un delito violento tendrá un gran daño en las relaciones públicas de un empleador, más allá de la responsabilidad directa por no proteger al empleado.

El análisis de comportamiento funciona de manera única más allá de la simple seguridad y, debido a su capacidad para observar violaciones en patrones estándar de protocolos, puede encontrar efectivamente actos inseguros de los empleados que pueden resultar en incidentes de compensación laboral o de responsabilidad pública. También en este caso la evaluación de los costes de futuros incidentes no se ajusta a la realidad. Un estudio realizado por Liberty Mutual Insurance Company mostró que el costo para los empleadores es aproximadamente seis veces el costo asegurado directo, ya que los costos no asegurados de los daños consecuentes incluyen trabajadores de reemplazo temporal, costos de contratación de reemplazos, costos de capacitación, tiempo de los gerentes en informes o tribunales, costos adversos. moral en otros trabajadores y efecto en las relaciones públicas y con los clientes. ^[12] El potencial de la IA en forma de análisis de comportamiento para interceptar y prevenir de manera proactiva tales incidentes es significativo.

Ver también

Referencias

^ "Video Analytics: descripción general | Temas de ScienceDirect". www.sciencedirect.com . Consultado el 1 de noviembre de 2020 .
^ Green, Mary W. (1999) El uso apropiado y eficaz de tecnologías de seguridad en las escuelas de EE. UU., Una guía para escuelas y organismos encargados de hacer cumplir la ley , Laboratorios Nacionales Sandia
^ Sulman, N.; Sanocki, T.; Goldgof, D.; Kasturi, R., ¿Qué tan efectivo es el desempeño de la videovigilancia humana?, Reconocimiento de patrones , ICPR 2008. 19ª Conferencia Internacional sobre, vol., no., pp.1,3, 8-11 de diciembre de 2008.
^ Nuechterlein, KH, Parasuraman, R. y Jiang, Q. (1983). Atención visual sostenida: la degradación de la imagen produce una rápida disminución de la sensibilidad con el tiempo . Ciencia, 220, 327-329
^ Pedro Domingos, El algoritmo maestro: cómo la búsqueda de la máquina de aprendizaje definitiva rehará nuestro mundo , 22 de septiembre de 2015 Libros básicos
^ Davies, ER (2012) Visión por computadora y máquina, cuarta edición: teoría, algoritmos y aspectos prácticos Academic Press, Waltham Mass.
^ Dufour, Jean-Yves, Sistemas inteligentes de videovigilancia , editor John Wiley (2012)
^ Hantman, Ken (2014) ¿Qué es el análisis de vídeo, explicado de forma sencilla?
^ Rice, Derek, Encontrar y vender el valor de la analítica , Revista SDM (septiembre de 2015) BNP Media II, Troy Michigan
^ Gruber, Illy, La evolución del análisis de vídeo , revista Security Sales & Integration (11 de agosto de 2012) Security Sales & Integration, Framingham MA
^ Bressler, Martin S., El impacto del delito en las empresas: un modelo de prevención, detección y remedio , Journal of Management and Marketing Research (2009)
^ Informe del índice de seguridad , Liberty Mutual Insurance Company (2002)