El reconocimiento automático de contenido [1] ( ACR ) es una tecnología utilizada para identificar el contenido reproducido en un dispositivo multimedia o presentado dentro de un archivo multimedia. Los dispositivos con ACR pueden permitir la recopilación de información sobre el consumo de contenido automáticamente en el nivel de la pantalla, sin ninguna entrada o esfuerzo de búsqueda por parte del usuario. Esta información puede recopilarse para fines tales como publicidad personalizada, recomendaciones de contenido, venta a agregadores de datos de clientes y otras aplicaciones. [2] [1]
Para iniciar el proceso, se selecciona un clip multimedia corto (audio, vídeo o ambos) desde un archivo multimedia o se captura como se muestra en un dispositivo como un televisor inteligente . Utilizando técnicas como huellas dactilares y marcas de agua , el software ACR compara el contenido seleccionado con una base de datos de obras grabadas conocidas. [1] Si la huella digital del clip multimedia encuentra una coincidencia, el software ACR devuelve los metadatos correspondientes sobre los medios, así como otro contenido asociado o recomendado, a la aplicación cliente para mostrarlos al usuario o para que los recopile el fabricante del dispositivo. o un agregador de datos. [2]
Dos metodologías líderes para ACR basado en audio son la huella digital acústica y la marca de agua . De manera similar, la toma de huellas digitales por video se utiliza para facilitar la ACR para medios visuales.
La toma de huellas dactilares acústica genera huellas dactilares únicas a partir del propio contenido de audio. Las técnicas de toma de huellas dactilares son independientes del formato del contenido, el códec, la velocidad de bits y las técnicas de compresión. [3] Esto hace posible el empleo de huellas dactilares acústicas en varias redes y canales [ se necesita aclaración ] y se usa ampliamente para la televisión interactiva, aplicaciones de segunda pantalla y sectores de monitoreo de contenido. [4] [5] Aplicaciones populares como Shazam , YouTube , Facebook , [6] TheTake, WeChat y Weibo supuestamente utilizan una metodología de huellas dactilares de audio para reconocer el contenido reproducido desde un televisor y activar funciones adicionales como votos, loterías, temas o compras. [ cita necesaria ]
A diferencia de las huellas dactilares, las marcas de agua digitales requieren la inclusión de "etiquetas" digitales [ se necesita más explicación ] integradas en el flujo de contenido digital antes de la distribución. Por ejemplo, un codificador de transmisión podría insertar una marca de agua cada pocos segundos que podría usarse para identificar el canal de transmisión, el ID del programa y la marca de tiempo. Esta marca de agua normalmente es inaudible o invisible para los usuarios, pero es detectable mediante dispositivos de visualización como teléfonos o tabletas que pueden leer las marcas de agua para identificar el contenido que se está reproduciendo. [7] La tecnología de marcas de agua también se utiliza en el campo de la protección de medios para ayudar a identificar dónde se originan las copias ilegales . [8]
En 2011, el servicio Shazam aplicó la tecnología ACR al contenido de televisión , lo que captó la atención de la industria de la televisión. Shazam era anteriormente un servicio de reconocimiento de música que reconocía música de grabaciones de sonido. Al utilizar su propia tecnología de huellas dactilares para identificar canales y vídeos en vivo, Shazam extendió su negocio a la programación de televisión. También en 2011, Samba TV (en ese momento conocido como Flingo [9] ) presentó su tecnología patentada de video ACR, que utiliza huellas digitales de video para identificar contenido en pantalla y potenciar aplicaciones de TV interactivas en pantallas cruzadas en televisores inteligentes. [10] En 2012, el proveedor de comunicaciones por satélite DIRECTV se asoció con el proveedor de fidelidad de televisión Viggle para proporcionar una experiencia de visualización interactiva en la segunda pantalla. En 2013, LG se asoció con Cognitive Networks (más tarde comprada por Vizio y rebautizada como Inscape), un proveedor de ACR, para proporcionar interacción impulsada por ACR. [11] En 2015, la tecnología ACR se extendió a aún más aplicaciones y televisores inteligentes. Los fabricantes de aplicaciones sociales y televisores como Facebook , Twitter , Google , WeChat , Weibo , LG , Samsung y Vizio TV han utilizado tecnología ACR desarrollada por ellos mismos o integrada por proveedores externos de ACR. [ cita necesaria ] En 2016, estuvieron disponibles aplicaciones adicionales y sistemas operativos móviles integrados con servicios de reconocimiento automático de contenido, incluidos Peach, Omusic y Mi OS. [12] [13] [14]
Los datos recopilados sobre los hábitos de consumo de medios de los clientes son muy valiosos para los fabricantes de dispositivos, los anunciantes y las empresas de agregación de datos. La tecnología ACR ayuda a estas empresas a estudiar los intereses de los clientes y recopilar datos para poder dirigirlos con mayor precisión a campañas de marketing y publicidad personalizadas . En noviembre de 2021 se informó que el fabricante de televisores inteligentes Vizio obtiene más ganancias con la venta de los datos de sus clientes que con los televisores que vende. [15]
Ahora se pueden lograr métricas de medición de audiencia en tiempo real aplicando la tecnología ACR en televisores inteligentes, decodificadores y dispositivos móviles como teléfonos inteligentes y tabletas. Estos datos de medición son fundamentales para cuantificar el consumo de la audiencia para fijar políticas de precios publicitarios.
La tecnología ACR ayuda a las audiencias a recuperar información sobre el contenido que vieron o escucharon. [16] El contenido de vídeo y música identificado puede vincularse a proveedores de contenidos de Internet para su visualización bajo demanda, a terceros para obtener información general adicional o a medios complementarios.
Debido a que los dispositivos pueden ser "conscientes" del contenido que se ve o escucha, los dispositivos de segunda pantalla pueden ofrecer a los usuarios contenido complementario más allá de lo que se presenta en la pantalla de visualización principal. La tecnología ACR no sólo puede identificar el contenido, sino que también puede identificar la ubicación precisa dentro del contenido y presentar información adicional a los usuarios. ACR también puede habilitar una variedad de funciones interactivas como encuestas, cupones, lotería o compra de productos según la marca de tiempo. [17]
Organizaciones que van desde los defensores de los derechos del consumidor Electronic Frontier Foundation hasta sitios web de tecnología como PCMag han expresado serias objeciones a la recopilación de los hábitos de consumo de visualización de los usuarios en sus dispositivos por motivos de privacidad. [18] [19] Dicho esto, la configuración de la mayoría de los dispositivos ofrece la opción de desactivar esta función. [ cita necesaria ]
Los proveedores de servicios ACR incluyen ACRCloud , Beatgrid, Digimarc , Gracenote , Inscape Data Services , Kantar Media , Pex, Red Bee Media , Samba TV , Shazam y Zapr Media Labs.