Así, la detección de eventos sociales es el proceso mediante el cual se clasifican y agrupan en distintos eventos un conjunto de datos multimedia dados previamente.
En consecuencia, encontrar contenido multimedia (digital) relacionado con un evento social concreto supone un reto.
Así, surge como imprescindible la creación de algoritmos que puedan facilitar esta tarea a los usuarios.
Pudiendo así hacer una estimación a priori sobre si saldría rentable organizar un tipo de evento de características similares a otro que ya se haya realizado.
Para esta nueva etapa de pre clasificado (Entrenamiento), se tiene que seleccionar las muestras del dominio con el que se trabaja y separarlo en clases, donde cada clase, engloba todas aquellas fotos con características similares.
Las técnicas tradicionales de geolocalización en cuanto a eventos sociales utilizan tanto la geolocalización como la marca temporal, dado un margen de tiempo, para reconocer eventos como uno mismo.
Como las fotos de estos eventos las hacen personas que participan o que asisten a él, se parte de la idea de que una persona no puede estar en 2 lugares diferentes a la vez, permitiendo así crear una clasificación espacio-temporal.
Una vez agrupadas las imágenes espacio-temporalmente, se pueden comparar visualmente o por texto aquellas fotos que no tienen geolocalización con las que sí tienen para comprobar si son eventos diferentes, o en caso contrario, demostrar que pertenecen al mismo evento o alguno parecido para clasificarlas dentro del mismo grupo.
Para utilizar este método, se extraen los puntos de interés de una imagen mediante descriptores visuales como DoG, ya que una comparación pixel a pixel puede costar mucho tiempo sin dar un resultado que lo compense.
Sea B un suceso cualquiera del que se conocen las probabilidades condicionales
Cuando las nuevas muestras se ponen en correspondencia con dicho modelo, en función de su proximidad pueden ser clasificadas a una u otra clase.
K-NN (K Nearest Neighbors) es un método de clasificación supervisada.
Para clasificar una nueva imagen a partir del K-NN, primero, se determina la posición en el plano X/Y.
A continuación, se traza una circunferencia con centro en el objeto que debemos determinar.
Esta, encierra otros imágenes clasificadas previamente las cuales nos aportan las posibles clases a las que podemos pertenecer.
El motivo por el cual es más efectivo clasificar a partir de los metadatos de la imagen, es que procesar texto es más rápido que analizar una imagen y extraer sus propias características.
Para poder tener una mayor efectividad en el clasificador, y poderlo realizar a partir de los metadatos de la imagen, es necesario tener un buen clasificador de texto el cual te diga si esa palabra en concreto es una palabra clave o no lo es.
Para ello tendremos que buscar los metadatos de las imágenes y los recursos informáticos utilizados.
La determinación de la correcta detección será comprobar si los sistemas proporcionan una respuesta para cada imagen.
Para cada evento, se produce un valor umbral entre 0 y 1, como más cercano esté a la unidad mejor, ya que querrá decir que la imagen se corresponde con más exactitud a dicho evento.
Esta puntuación se utiliza para clasificar imágenes o videos en orden descendente porque se ordenaron las imágenes de las más cercanas al 1 hasta la más cercana al valor 0, de manera que las primeras imágenes serán las que se correspondan mejor con el evento.
Estos dos parámetros se pueden calcular para cada posición en el vector fila.
Ambos se utilizarán para evaluar el solapamiento entre grupos y clases.
Condiciones de evaluación en MediaEval[1]: Son las opciones que tienen los participantes en la presentación de los resultados de la evaluación: Por otra parte, MED también patrocina varias opciones para carreras contrastantes para que los artistas puedan evaluar solo los subsistemas en los componentes multimedia: Para participar en el MED, los participantes deben crear un elemento codificado y el concepto base.
Una de las mejoras más importantes ha sido la capacidad de los móviles para permitir a los usuarios subir imágenes con datos como títulos, geolocalización, o data y hora tan pronto como se inicia o abandona el evento, y el streaming, que permite una reproducción a tiempo real.
Esta mejora ha permitido agilizar la subida de información a la red.