stringtranslate.com

Sistema de filtrado de información

Un sistema de filtrado de información es un sistema que elimina información redundante o no deseada de un flujo de información utilizando métodos (semi)automatizados o computarizados antes de presentarla a un usuario humano. Su objetivo principal es la gestión de la sobrecarga de información y el incremento de la relación señal-ruido semántica . Para ello, el perfil del usuario se compara con algunas características de referencia. Estas características pueden provenir del elemento de información (enfoque basado en el contenido) o del entorno social del usuario ( enfoque de filtrado colaborativo ).

Mientras que en el procesamiento de señales de transmisión de información se utilizan filtros contra el ruido que altera la sintaxis a nivel de bits, los métodos empleados en el filtrado de información actúan a nivel semántico.

La gama de métodos de máquina empleados se basa en los mismos principios que los utilizados para la extracción de información . Una aplicación notable puede encontrarse en el campo de los filtros de correo no deseado . Por lo tanto, no es solo la explosión de información la que necesita algún tipo de filtro, sino también la pseudoinformación introducida de forma inadvertida o maliciosa .

A nivel de presentación, el filtrado de información toma la forma de canales de noticias basados ​​en las preferencias del usuario , etc.

Los sistemas de recomendación y las plataformas de descubrimiento de contenido son sistemas de filtrado de información activa que intentan presentar al usuario elementos de información ( películas , televisión , música , libros , noticias , páginas web ) que le interesan. Estos sistemas añaden elementos de información a la información que fluye hacia el usuario, en lugar de eliminar elementos de información del flujo de información hacia el usuario. Los sistemas de recomendación suelen utilizar enfoques de filtrado colaborativo o una combinación de los enfoques de filtrado colaborativo y filtrado basado en contenido, aunque existen sistemas de recomendación basados ​​en contenido.

Historia

Antes de la llegada de Internet , ya existían varios métodos de filtrado de información ; por ejemplo, los gobiernos podían controlar y restringir el flujo de información en un país determinado mediante censura formal o informal.

Por otro lado, vamos a hablar de filtros de información si nos referimos a los editores de periódicos y periodistas cuando prestan un servicio que selecciona la información más valiosa para sus clientes, lectores de libros, revistas, periódicos, radioescuchas y telespectadores . Esta operación de filtrado también está presente en escuelas y universidades donde se realiza una selección de información para prestar asistencia en base a criterios académicos a los clientes de este servicio, los estudiantes. Con la llegada de Internet es posible que cualquier persona pueda publicar lo que desee a un bajo coste. De esta forma, aumenta considerablemente la información menos útil y en consecuencia se difunde información de calidad. Con esta problemática, se empezaron a idear nuevos filtrados con los que podemos obtener la información requerida para cada tema específico de forma fácil y eficaz.

Operación

Un sistema de filtrado de este estilo consta de varias herramientas que ayudan a las personas a encontrar la información más valiosa, de forma que el tiempo limitado que se puede dedicar a leer/escuchar/visualizar, se dirija correctamente a los documentos más interesantes y valiosos. Estos filtros también se utilizan para organizar y estructurar la información de forma correcta y comprensible, además de agrupar los mensajes en el correo al que van dirigidos. Estos filtros son fundamentales en los resultados que se obtienen de los buscadores en Internet. Las funciones de filtrado mejoran cada día para conseguir una descarga de documentos web y mensajes más eficientes.

Criterio

Uno de los criterios que se utilizan en este paso es si el conocimiento es nocivo o no, si el conocimiento permite una mejor comprensión con o sin el concepto. En este caso la tarea de filtrado de la información para reducir o eliminar la información nociva con el conocimiento.

Sistema de aprendizaje

Un sistema de contenidos de aprendizaje consta, en reglas generales, principalmente de tres etapas básicas:

  1. En primer lugar, un sistema que proporciona soluciones a un conjunto definido de tareas.
  2. Posteriormente, se somete a criterios de evaluación que medirán el desempeño de la etapa anterior en relación a la solución de problemas.
  3. Módulo de adquisición que obtiene como salida conocimientos que son utilizados en el sistema solucionador de la primera etapa.

Futuro

Actualmente el problema no es encontrar la mejor forma de filtrar la información , sino la forma en que estos sistemas requieren aprender de manera autónoma las necesidades de información de los usuarios. No sólo porque automatizan el proceso de filtrado sino también la construcción y adaptación del filtro. Algunas ramas basadas en ello, como la estadística, el aprendizaje automático, el reconocimiento de patrones y la minería de datos, son la base para desarrollar filtros de información que aparecen y se adaptan en función de la experiencia. Para llevar a cabo el proceso de aprendizaje, parte de la información tiene que ser prefiltrada, lo que significa que hay ejemplos positivos y negativos que llamamos datos de entrenamiento, que pueden ser generados por expertos, o mediante retroalimentación de usuarios comunes.

Error

A medida que se van introduciendo datos, el sistema incluye nuevas reglas; si consideramos que estos datos pueden generalizar la información de los datos de entrenamiento, entonces tenemos que evaluar el desarrollo del sistema y medir la capacidad del sistema para predecir correctamente las categorías de nueva información . Este paso se simplifica separando los datos de entrenamiento en una nueva serie llamada "datos de prueba" que utilizaremos para medir la tasa de error. Como regla general es importante distinguir entre tipos de errores (falsos positivos y falsos negativos). Por ejemplo, en el caso de un agregador de contenidos para niños, no tiene la misma gravedad permitir el paso de información no apta para ellos, que muestre violencia o pornografía, que el error de descartar alguna información apropiada. Para mejorar el sistema para bajar las tasas de error y tener estos sistemas con capacidades de aprendizaje similares a las de los humanos requerimos el desarrollo de sistemas que simulen las capacidades cognitivas humanas, como la comprensión del lenguaje natural , la captura de significado común y otras formas de procesamiento avanzado para lograr la semántica de la información.

Campos de uso

Hoy en día, existen numerosas técnicas para desarrollar filtros de información, algunas de estas alcanzan tasas de error inferiores al 10% en diversos experimentos. [ cita requerida ] Entre estas técnicas se encuentran los árboles de decisión, las máquinas de vectores de soporte, las redes neuronales, las redes bayesianas, los discriminantes lineales, la regresión logística, etc. En la actualidad, estas técnicas se utilizan en diferentes aplicaciones, no sólo en el contexto web, sino en cuestiones temáticas tan variadas como el reconocimiento de voz, la clasificación de la astronomía telescópica o la evaluación del riesgo financiero.

Véase también

Referencias

Enlaces externos