Un motor de búsqueda de vídeos es un motor de búsqueda basado en la Web que rastrea la Web en busca de contenido de vídeo . Algunos motores de búsqueda de vídeos analizan el contenido alojado externamente, mientras que otros permiten que el contenido se cargue y aloje en sus propios servidores. Algunos motores también permiten a los usuarios buscar por tipo de formato de vídeo y por duración del clip. Los resultados de la búsqueda de vídeos suelen ir acompañados de una vista en miniatura del vídeo.
Los buscadores de vídeo son programas informáticos diseñados para encontrar vídeos almacenados en dispositivos digitales, ya sea a través de servidores de Internet o en unidades de almacenamiento del mismo ordenador. Estas búsquedas se pueden realizar a través de la indexación audiovisual , que puede extraer información del material audiovisual y registrarla como metadatos, que serán rastreados por los buscadores.
El uso principal de estos buscadores es la creciente creación de contenidos audiovisuales y la necesidad de gestionarlos adecuadamente. La digitalización de los archivos audiovisuales y la aparición de Internet han dado lugar a que grandes cantidades de archivos de vídeo se almacenen en grandes bases de datos, cuya recuperación puede resultar muy difícil debido a los enormes volúmenes de datos y a la existencia de una brecha semántica.
El criterio de búsqueda utilizado por cada motor de búsqueda depende de su naturaleza y finalidad de las búsquedas.
Los metadatos son información sobre hechos. Puede ser información sobre quién es el autor del vídeo, fecha de creación, duración y toda la información que se pueda extraer e incluir en los mismos archivos. En Internet se suele utilizar un lenguaje llamado XML para codificar metadatos, que funciona muy bien a través de la web y es legible por las personas. Así, a través de esta información contenida en estos archivos es la forma más sencilla de encontrar datos que nos interesen.
En los vídeos hay dos tipos de metadatos, los que podemos integrar en el propio código del vídeo y los metadatos externos de la página donde está el vídeo. En ambos casos los optimizamos para que sean ideales a la hora de indexarlos.
Todos los formatos de vídeo incorporan sus propios metadatos. Son posibles el título, la descripción, la calidad de la codificación o la transcripción del contenido. Para revisar estos datos existen programas como FLV MetaData Injector, Sorenson Squeeze o Castfire. Cada uno de ellos tiene unas utilidades y especificaciones especiales.
Al convertir de un formato a otro se pueden perder muchos de estos datos, por lo que conviene comprobar que la información del nuevo formato sea correcta. Por ello, es recomendable tener el vídeo en varios formatos, de forma que todos los robots de búsqueda puedan encontrarlo e indexarlo.
En la mayoría de los casos se deben aplicar los mismos mecanismos que en el posicionamiento de una imagen o un contenido textual.
Son los factores más importantes a la hora de posicionar un vídeo, ya que contienen la mayor parte de la información necesaria. Los títulos tienen que ser claramente descriptivos y deben eliminar toda palabra o frase que no sea útil.
Debe ser descriptivo, incluyendo palabras clave que describan el video sin necesidad de ver el título o descripción del mismo. Lo ideal es separar las palabras con guiones "-".
En la página donde se encuentra el vídeo debe aparecer una lista de palabras clave vinculadas al microformato “rel-tag”. Estas palabras serán utilizadas por los buscadores como base para organizar la información.
Aunque no es completamente estándar, existen dos formatos que almacenan información en un componente temporal que se especifica, uno para subtítulos y otro para transcripciones, que también se puede utilizar para subtítulos. Los formatos son SRT o SUB para subtítulos y TTXT para transcripciones.
El reconocimiento de voz consiste en transcribir el discurso de la pista de audio de los vídeos, creando un archivo de texto. De esta forma y con la ayuda de un extractor de frases se puede buscar fácilmente si el contenido del vídeo es de interés. Algunos buscadores aparte de utilizar el reconocimiento de voz para buscar vídeos, también lo utilizan para encontrar el punto concreto de un archivo multimedia en el que se encuentra una palabra o frase concreta y así ir directamente a dicho punto. Gaudi (Google Audio Indexing), un proyecto desarrollado por Google Labs , utiliza la tecnología de reconocimiento de voz para localizar el momento exacto en el que se han pronunciado una o varias palabras dentro de un audio, permitiendo al usuario ir directamente al momento exacto en el que se han pronunciado las palabras. Si la consulta de búsqueda coincide con algunos vídeos de YouTube, las posiciones se indican mediante marcadores amarillos, y hay que pasar el ratón por encima para leer el texto transcrito.
Además de la transcripción, el análisis puede detectar diferentes hablantes y, en ocasiones, atribuir el discurso a un nombre identificado del hablante.
El reconocimiento de texto puede ser muy útil para reconocer personajes en los vídeos a través de “chyrons”. Al igual que ocurre con los reconocedores de voz, existen buscadores que permiten (a través del reconocimiento de caracteres) reproducir un vídeo desde un punto determinado.
TalkMiner, un ejemplo de búsqueda de fragmentos específicos de vídeos mediante reconocimiento de texto, analiza cada vídeo una vez por segundo en busca de signos identificadores de una diapositiva, como su forma y su carácter estático, captura la imagen de la diapositiva y utiliza el Reconocimiento Óptico de Caracteres (OCR) para detectar las palabras que aparecen en las diapositivas. Después, estas palabras son indexadas en el motor de búsqueda de TalkMiner, que actualmente ofrece a los usuarios más de 20.000 vídeos de instituciones como la Universidad de Stanford, la Universidad de California en Berkeley y TED.
A través de los descriptores visuales podemos analizar los fotogramas de un vídeo y extraer información que puede ser calificada como metadatos. Las descripciones se generan automáticamente y pueden describir diferentes aspectos de los fotogramas, como el color, la textura, la forma, el movimiento y la situación.
El análisis de vídeo permite la creación automática de capítulos, utilizando técnicas como el cambio de ángulo de cámara o la identificación de jingles de audio. Al conocer la estructura típica de un documento de vídeo, es posible identificar los créditos iniciales y finales, las partes del contenido y el comienzo y el final de las pausas publicitarias.
La utilidad de un motor de búsqueda depende de la relevancia del conjunto de resultados que arroja. Si bien puede haber millones de videos que incluyan una palabra o frase en particular, algunos videos pueden ser más relevantes, populares o tener más autoridad que otros. Esta disposición tiene mucho que ver con la optimización de motores de búsqueda.
La mayoría de los buscadores utilizan distintos métodos para clasificar los resultados y ofrecer el mejor vídeo en los primeros resultados. Sin embargo, la mayoría de los programas permiten ordenar los resultados según varios criterios.
Este criterio es más ambiguo y menos objetivo, pero en ocasiones es el más cercano a lo que queremos; depende totalmente del buscador y del algoritmo que haya elegido el propietario. Por eso siempre se ha discutido y ahora que los resultados de búsqueda están tan arraigados en nuestra sociedad se ha discutido aún más. Este tipo de gestión depende muchas veces del número de veces que sale la palabra buscada, del número de visualizaciones de esta, del número de páginas que enlazan a ese contenido y de las valoraciones que dan los usuarios que lo han visto. [1]
Este es un criterio basado totalmente en la cronología. Los resultados se pueden ordenar según su antigüedad en el repositorio.
Puede darnos una idea de la popularidad de cada vídeo.
Esta es la duración del vídeo y puede dar una idea de qué vídeo es.
Es una práctica habitual en los repositorios dejar que los usuarios califiquen los vídeos, de forma que un contenido de calidad y relevancia tenga un alto rango en la lista de resultados ganando visibilidad. Esta práctica está muy relacionada con las comunidades virtuales.
Podemos distinguir dos tipos básicos de interfaces, unas son páginas web alojadas en servidores a las que se accede vía Internet y se realizan búsquedas a través de la red, y otras son programas de ordenador que realizan búsquedas dentro de una red privada.
Dentro de las interfaces de Internet podemos encontrar repositorios que alojan archivos de vídeo que incorporan un buscador que busca únicamente en sus propias bases de datos, y buscadores de vídeos sin repositorio que buscan en fuentes de software externo.
Proporciona alojamiento en archivos de vídeo almacenados en sus servidores y suele tener un buscador integrado que realiza búsquedas entre los vídeos subidos por sus usuarios. Uno de los primeros repositorios web, o al menos los más famosos son los portales Vimeo, Dailymotion y YouTube.
Sus búsquedas se basan muchas veces en la lectura de las etiquetas de metadatos, títulos y descripciones que los usuarios asignan a sus vídeos. El criterio de disposición y ordenación de los resultados de estas búsquedas suele ser seleccionable entre la fecha de subida del archivo, el número de visualizaciones o lo que ellos llaman la relevancia. Aún así, los criterios de ordenación son hoy en día la principal arma de estas webs, pues el posicionamiento de los vídeos es importante en términos de promoción. [ cita requerida ]
Son sitios web especializados en la búsqueda de vídeos en la red o en determinados repositorios preseleccionados. Funcionan a través de arañas web que inspeccionan la red de forma automatizada para crear copias de los sitios web visitados, que luego serán indexados por los buscadores, de forma que puedan proporcionar búsquedas más rápidas.
En ocasiones, un buscador sólo realiza búsquedas en archivos audiovisuales almacenados en un ordenador o, como ocurre en los televisores, en un servidor privado al que los usuarios acceden a través de una red de área local. Estos buscadores suelen ser software o aplicaciones ricas de Internet con unas opciones de búsqueda muy concretas para conseguir la máxima velocidad y eficacia a la hora de presentar los resultados. Suelen utilizarse para grandes bases de datos y, por tanto, están muy enfocados a satisfacer las necesidades de las empresas de televisión. Un ejemplo de este tipo de software sería Digition Suite, que además de ser un referente en este tipo de interfaces, está muy cerca de nosotros en cuanto al sistema de almacenamiento y recuperación de ficheros de la Corporació Catalana de Mitjans Audiovisuals . [2]
Esta suite en particular y quizás en su punto más fuerte es que integra todo el proceso de creación, indexación, almacenamiento, búsqueda, edición y recuperación. Una vez que tenemos un contenido audiovisual digitalizado se indexa con diferentes técnicas de distinto nivel en función de la importancia del contenido y se almacena en él. El usuario, cuando quiere recuperar un determinado archivo, tiene que rellenar unos campos de búsqueda como el título del programa, la fecha de emisión, los personajes que actúan o el nombre de la productora, y el robot inicia la búsqueda. Una vez que aparecen los resultados y los ordena según sus preferencias, el usuario puede reproducir los vídeos en baja calidad para trabajar lo más rápido posible. Cuando encuentra el contenido deseado, lo descarga con buena definición, lo edita y lo reproduce. [3]
La búsqueda de vídeos ha evolucionado lentamente a través de varios formatos de búsqueda básicos que existen en la actualidad y todos utilizan palabras clave . Las palabras clave para cada búsqueda se pueden encontrar en el título del medio, en cualquier texto adjunto al medio y en páginas web vinculadas al contenido, también definidas por los autores y usuarios de los recursos alojados en vídeo.
Algunas búsquedas de vídeo se realizan mediante búsquedas manuales, mientras que otras crean sistemas tecnológicos que funcionan automáticamente para detectar lo que hay en el vídeo y satisfacer las necesidades de los buscadores. Muchos esfuerzos por mejorar la búsqueda de vídeo, tanto la búsqueda manual como la creación de algoritmos que reconozcan lo que hay dentro del vídeo, han supuesto un rediseño completo de los esfuerzos de búsqueda.
En general, se reconoce que es posible convertir voz a texto, aunque recientemente Thomas Wilde, el nuevo director ejecutivo de Everyzing, reconoció que Everyzing funciona el 70% del tiempo cuando hay música, ruido ambiental o más de una persona hablando. Si se puede hablar al estilo de un noticiero (una persona que habla con claridad, sin ruido ambiental), ese porcentaje puede aumentar hasta el 93%. (De la Web Video Summit, San José, California, 27 de junio de 2007).
En cada idioma existen alrededor de 40 fonemas y en todos los idiomas hablados unos 400. En lugar de aplicar un algoritmo de búsqueda de texto una vez finalizado el procesamiento de voz a texto, algunos motores utilizan un algoritmo de búsqueda fonética para encontrar resultados dentro de la palabra hablada. Otros funcionan escuchando literalmente el podcast entero y creando una transcripción de texto mediante un sofisticado proceso de voz a texto. Una vez creado el archivo de texto, se puede buscar en él cualquier cantidad de palabras y frases de búsqueda.
Se reconoce en general que la búsqueda visual en vídeos no funciona bien y que ninguna empresa la utiliza públicamente. Investigadores de la Universidad de California en San Diego y de la Universidad Carnegie Mellon llevan más de 15 años trabajando en el problema de la búsqueda visual y admitieron en una conferencia sobre el "Futuro de la búsqueda" celebrada en la Universidad de California en Berkeley en la primavera de 2007 que faltaban años para que fuera viable incluso en una búsqueda simple.
Búsqueda que no se ve afectada por el alojamiento del vídeo, donde los resultados son independientes sin importar dónde se encuentre el vídeo:
Los resultados de la búsqueda se modifican o son sospechosos debido a que al video alojado de gran tamaño se le da un tratamiento preferencial en los resultados de búsqueda:
Proceso de los motores de búsqueda Cómo funcionan las cosas (en inglés)