Minería de textos

[2]​ Los textos que se usan como recursos pueden ser páginas web, libros, correos electrónicos, reseñas de clientes, artículos, entre otros.El preprocesamiento incluye eliminar todas las partes del texto que no son necesarias.Además, se pueden eliminar los signos de puntuación, o incluso reducir las palabras a sus raíces.[5]​ Cada término que se encuentra dentro del texto puede ser enriquecido al agregarle una etiqueta.En este caso, las palabras obtienen una etiqueta que las define como “sustantivos”, “adjetivos”, “adverbios”, entre otros.En este caso las etiquetas que se agregan pueden ser del tipo “personas”, “organizaciones”, entre otras.[5]​ Para poder analizar los textos con algoritmos que se emplean a la hora de analizar datos numéricos, como algoritmos estadísticos o de inteligencia artificial, el texto debe ser convertido a números.Esto puede llevarse a cabo convirtiendo los textos en vectores que sean de bits o numéricos.Generalmente, estas agrupaciones se hacen usando el Aprendizaje Supervisado de Inteligencia Artificial.
Análisis automatizado de las elecciones presidenciales de EE. UU. mediante Big Data y análisis de redes