stringtranslate.com

motor de búsqueda de vídeos

Un motor de búsqueda de vídeos es un motor de búsqueda basado en web que rastrea la web en busca de contenido de vídeo . Algunos motores de búsqueda de vídeos analizan el contenido alojado externamente, mientras que otros permiten que el contenido se cargue y aloje en sus propios servidores. Algunos motores también permiten a los usuarios buscar por tipo de formato de vídeo y por duración del clip. Los resultados de la búsqueda de vídeos suelen ir acompañados de una vista en miniatura del vídeo.

Los buscadores de vídeos son programas informáticos diseñados para encontrar vídeos almacenados en dispositivos digitales, ya sea a través de servidores de Internet o en unidades de almacenamiento del mismo ordenador. Estas búsquedas se pueden realizar a través de indexación audiovisual , que puede extraer información del material audiovisual y registrarla como metadatos, que serán rastreados por los motores de búsqueda.

Utilidad

El principal uso de estos buscadores es la creciente creación de contenidos audiovisuales y la necesidad de gestionarlos adecuadamente. La digitalización de los archivos audiovisuales y la implantación de Internet, ha dado lugar a que grandes cantidades de archivos de vídeo se almacenen en grandes bases de datos, cuya recuperación puede resultar muy difícil debido a los enormes volúmenes de datos y a la existencia de una brecha semántica.

Criterio de búsqueda

El criterio de búsqueda utilizado por cada motor de búsqueda depende de su naturaleza y finalidad de las búsquedas.

Metadatos

Los metadatos son información sobre hechos. Podría ser información sobre quién es el autor del vídeo, fecha de creación, duración y toda la información que pueda extraerse e incluirse en los mismos archivos. Internet se utiliza a menudo en un lenguaje llamado XML para codificar metadatos, que funciona muy bien en la web y es legible por las personas. Así, a través de esta información contenida en estos ficheros es la forma más sencilla de encontrar datos de nuestro interés.

En los vídeos hay dos tipos de metadatos, que podemos integrar en el propio código del vídeo y metadatos externos de la página donde está el vídeo. En ambos casos los optimizamos para que sean ideales al indexar.

Metadatos internos

Todos los formatos de vídeo incorporan sus propios metadatos. Son posibles el título, la descripción, la calidad de codificación o la transcripción del contenido. Para revisar estos datos existen programas como FLV MetaData Injector, Sorenson Squeeze o Castfire. Cada uno tiene algunas utilidades y especificaciones especiales.

La conversión de un formato a otro puede perder gran parte de estos datos, así que verifique que la información del nuevo formato sea correcta. Por lo tanto, es recomendable tener el vídeo en múltiples formatos, para que todos los robots de búsqueda puedan encontrarlo e indexarlo.

Metadatos externos

En la mayoría de los casos se deben aplicar los mismos mecanismos que en el posicionamiento de una imagen o contenido textual.

Título y descripción

Son los factores más importantes a la hora de posicionar un vídeo, porque contienen la mayor parte de la información necesaria. Los títulos tienen que ser claramente descriptivos y deben eliminar toda palabra o frase que no sea útil.

Nombre del archivo

Debe ser descriptivo, incluyendo palabras clave que describan el vídeo sin necesidad de ver su título o descripción. Lo ideal es separar las palabras mediante guiones "-".

Etiquetas

En la página donde está el vídeo debe haber una lista de palabras clave vinculadas al microformato "rel-tag". Estas palabras serán utilizadas por los motores de búsqueda como base para organizar la información.

Transcripción y subtítulos

Aunque no son del todo estándar, existen dos formatos que almacenan información en un componente temporal que se especifica, uno para subtítulos y otro para transcripciones, que también se puede utilizar para subtítulos. Los formatos son SRT o SUB para subtítulos y TTXT para transcripciones.

Reconocimiento de voz

El reconocimiento de voz consiste en una transcripción del discurso de la pista de audio de los vídeos, creando un archivo de texto. De esta forma y con la ayuda de un extractor de frases podremos buscar fácilmente si el contenido del vídeo es de nuestro interés. Algunos buscadores además de utilizar el reconocimiento de voz para buscar vídeos, también lo utilizan para encontrar el punto concreto de un archivo multimedia en el que se encuentra una palabra o frase concreta y así ir directamente a ese punto. Gaudí (Google Audio Indexing), un proyecto desarrollado por Google Labs , utiliza tecnología de reconocimiento de voz para localizar el momento exacto en que se han dicho una o más palabras dentro de un audio, permitiendo al usuario ir directamente al momento exacto en que se dijeron las palabras. Si la consulta de búsqueda coincide con algunos vídeos de YouTube, las posiciones se indican con marcadores amarillos, debiendo pasar el ratón por encima para leer el texto transcrito.

Reconocimiento del orador

Además de la transcripción, el análisis puede detectar diferentes hablantes y, en ocasiones, atribuir el discurso a un nombre identificado del hablante.

Reconocimiento de texto

El reconocimiento de texto puede resultar muy útil para reconocer personajes en los vídeos mediante "chyrons". Al igual que ocurre con los reconocedores de voz, existen buscadores que permiten (mediante el reconocimiento de caracteres) reproducir un vídeo desde un punto concreto.

TalkMiner, un ejemplo de búsqueda de fragmentos específicos de vídeos mediante reconocimiento de texto, analiza cada vídeo una vez por segundo buscando signos identificadores de una diapositiva, como su forma y naturaleza estática, captura la imagen de la diapositiva y utiliza el Reconocimiento Óptico de Caracteres (OCR). ) para detectar las palabras en las diapositivas. Luego, estas palabras son indexadas en el motor de búsqueda de TalkMiner, que actualmente ofrece a sus usuarios más de 20.000 vídeos de instituciones como la Universidad de Stanford, la Universidad de California en Berkeley y TED.

Análisis de marco

A través de los descriptores visuales podemos analizar los fotogramas de un vídeo y extraer información que puede ser puntuada como metadatos. Las descripciones se generan automáticamente y pueden describir diferentes aspectos de los fotogramas, como el color, la textura, la forma, el movimiento y la situación.

Capítulos

El análisis de vídeo puede conducir a la creación de capítulos automáticos, utilizando técnicas como el cambio del ángulo de la cámara y la identificación de jingles de audio. Conociendo la estructura típica de un documento de vídeo, es posible identificar los créditos iniciales y finales, las partes de contenido y el inicio y final de las pausas publicitarias.

Criterio de clasificación

La utilidad de un motor de búsqueda depende de la relevancia del conjunto de resultados devuelto. Si bien puede haber millones de videos que incluyen una palabra o frase en particular, algunos videos pueden ser más relevantes, populares o tener más autoridad que otros. Esta disposición tiene mucho que ver con la optimización de motores de búsqueda.

La mayoría de los motores de búsqueda utilizan diferentes métodos para clasificar los resultados y ofrecer el mejor vídeo en los primeros resultados. Sin embargo, la mayoría de los programas permiten ordenar los resultados según varios criterios.

Ordenar por relevancia

Este criterio es más ambiguo y menos objetivo, pero en ocasiones es el que más se acerca a lo que queremos; Depende completamente del buscador y del algoritmo que el propietario haya elegido. Por eso siempre se ha debatido y ahora que los resultados de búsqueda están tan arraigados en nuestra sociedad se ha debatido aún más. Este tipo de gestión muchas veces depende del número de veces que sale la palabra buscada, del número de visualizaciones de esta, del número de páginas que enlazan a ese contenido y de las valoraciones dadas por los usuarios que lo han visto. [1]

Ordenar por fecha de carga

Este es un criterio basado totalmente en el cronograma. Los resultados se pueden ordenar según su antigüedad en el repositorio.

Ordenar por número de vistas

Puede darnos una idea de la popularidad de cada vídeo.

Ordenar por longitud

Esta es la duración del vídeo y puede dar una idea de qué vídeo es.

Ordenar por valoración de usuario

Es una práctica común en los repositorios dejar que los usuarios califiquen los videos, de modo que un contenido de calidad y relevancia tendrá un alto rango en la lista de resultados ganando visibilidad. Esta práctica está estrechamente relacionada con las comunidades virtuales.

Interfaces

Podemos distinguir dos tipos básicos de interfaces, unas son páginas web alojadas en servidores a las que se accede por Internet y se realizan búsquedas a través de la red, y otras son programas informáticos que realizan búsquedas dentro de una red privada.

Internet

Dentro de las interfaces de Internet podemos encontrar repositorios que alojan archivos de vídeo que incorporan un buscador que busca únicamente en sus propias bases de datos, y buscadores de vídeos sin repositorio que buscan en fuentes de software externo.

Repositorios con buscador de vídeos

Proporciona alojamiento en archivos de vídeo almacenados en sus servidores y suele tener un motor de búsqueda integrado que busca entre vídeos subidos por sus usuarios. Uno de los primeros repositorios web, o al menos el más famoso, son los portales Vimeo, Dailymotion y YouTube.

Sus búsquedas suelen basarse en la lectura de etiquetas de metadatos, títulos y descripciones que los usuarios asignan a sus vídeos. El criterio de disposición y orden de los resultados de estas búsquedas suele ser seleccionable entre la fecha de subida del archivo, el número de visualizaciones o lo que llaman la relevancia. Aún así, los criterios de clasificación son hoy en día el arma principal de estos sitios web, porque el posicionamiento de los vídeos es importante en términos de promoción. [ cita necesaria ]

Repositorios de buscadores de vídeos

Son sitios web especializados en buscar vídeos en la red o en determinados repositorios preseleccionados. Funcionan mediante arañas web que inspeccionan la red de forma automatizada para crear copias de los sitios web visitados, que luego serán indexadas por los motores de búsqueda, para que puedan realizar búsquedas más rápidas.

Red privada

Esquema de funcionamiento

En ocasiones un buscador sólo busca en archivos audiovisuales almacenados dentro de un ordenador o, como ocurre en los televisores, en un servidor privado al que los usuarios acceden a través de una red de área local. Estos buscadores suelen ser software o aplicaciones enriquecidas de Internet con opciones de búsqueda muy específicas para obtener la máxima velocidad y eficiencia a la hora de presentar los resultados. Suelen utilizarse para grandes bases de datos y por tanto están muy enfocados a satisfacer las necesidades de las empresas de televisión. Un ejemplo de este tipo de software sería el Digition Suite, que además de ser un referente en este tipo de interfaces, nos es muy cercano en cuanto al sistema de almacenamiento y recuperación de ficheros de la Corporació Catalana de Mitjans Audiovisuals . [2]

Esta suite en particular y quizás su punto más fuerte es que integra todo el proceso de creación, indexación, almacenamiento, búsqueda, edición y recuperación. Una vez que tenemos un contenido audiovisual digitalizado se indexa con diferentes técnicas de diferente nivel dependiendo de la importancia del contenido y del mismo almacenado. El usuario, cuando quiere recuperar un determinado archivo, debe rellenar campos de búsqueda como título del programa, fecha de emisión, personajes que actúan o el nombre del productor, y el robot inicia la búsqueda. Una vez que aparecen los resultados y ordenados según sus preferencias, el usuario puede reproducir los vídeos de baja calidad para trabajar lo más rápido posible. Cuando encuentra el contenido deseado, lo descarga en buena definición, lo edita y reproduce. [3]

Diseño y algoritmos.

La búsqueda de vídeos ha evolucionado lentamente a través de varios formatos de búsqueda básicos que existen hoy en día y todos utilizan palabras clave . Las palabras clave para cada búsqueda se pueden encontrar en el título del medio, cualquier texto adjunto al medio y las páginas web vinculadas al contenido, también definidas por los autores y usuarios de los recursos alojados en vídeo.

Algunas búsquedas de videos se realizan mediante búsqueda impulsada por humanos, otras crean sistemas tecnológicos que funcionan automáticamente para detectar lo que hay en el video y satisfacer las necesidades de los buscadores. Muchos esfuerzos para mejorar la búsqueda de videos, incluyendo tanto la búsqueda impulsada por humanos como el algoritmo de escritura que reconoce lo que hay dentro del video, han significado un redesarrollo completo de los esfuerzos de búsqueda.

Generalmente se reconoce que la conversión de voz a texto es posible, aunque recientemente Thomas Wilde, el nuevo CEO de Everyzing, reconoció que Everyzing funciona el 70% del tiempo cuando hay música, ruido ambiental o más de una persona hablando. Si está disponible el estilo de conversación de un noticiero (una persona, hablando claramente, sin ruido ambiental), esa cifra puede aumentar al 93%. (De Web Video Summit, San José, CA, 27 de junio de 2007).

Existen alrededor de 40 fonemas en cada idioma y alrededor de 400 en todos los idiomas hablados. En lugar de aplicar un algoritmo de búsqueda de texto una vez completado el procesamiento de voz a texto, algunos motores utilizan un algoritmo de búsqueda fonética para encontrar resultados dentro de la palabra hablada. Otros trabajan escuchando literalmente el podcast completo y creando una transcripción de texto mediante un sofisticado proceso de conversión de voz a texto. Una vez creado el archivo de texto, se puede buscar en él cualquier número de palabras y frases de búsqueda.

En general, se reconoce que la búsqueda visual de vídeos no funciona bien y que ninguna empresa la utiliza públicamente. Investigadores de la Universidad de California en San Diego y la Universidad Carnegie Mellon han estado trabajando en el problema de la búsqueda visual durante más de 15 años, y admitieron en una conferencia sobre el "Futuro de la Búsqueda" en la Universidad de California en Berkeley en la primavera de 2007 que faltaban años para que fuera viable incluso en términos simples. buscar.

Motores de búsqueda de vídeos

Búsqueda agnóstica

Búsqueda que no se ve afectada por el alojamiento del vídeo, donde los resultados son independientes sin importar dónde se encuentre el vídeo:

Búsqueda no agnóstica

Los resultados de búsqueda se modifican o son sospechosos debido a que el gran vídeo alojado recibe un trato preferencial en los resultados de búsqueda:

Ver también

Referencias

  1. ^ (en inglés) SEO por webmaster central de Google
  2. (en catalán) Digitalizar o morir (Alícia Conesa) Archivado el 8 de julio de 2011 en Wayback Machine .
  3. ^ (en catalán) Digition Suite de Activa Multimedia

enlaces externos

Proceso de los motores de búsqueda How Stuff Works (en inglés)