Análisis de los sentimientos

El análisis de sentimientos (también conocido como minería de opiniones o IA de emociones ) es el uso del procesamiento del lenguaje natural , el análisis de texto , la lingüística computacional y la biometría para identificar, extraer, cuantificar y estudiar sistemáticamente estados afectivos e información subjetiva. El análisis de sentimientos se aplica ampliamente a materiales de voz del cliente , como reseñas y respuestas a encuestas, redes sociales y en línea, y materiales de atención médica para aplicaciones que van desde marketing hasta servicio al cliente y medicina clínica. Con el surgimiento de modelos de lenguaje profundo, como RoBERTa, también se pueden analizar dominios de datos más difíciles, por ejemplo, textos de noticias donde los autores normalmente expresan su opinión/sentimiento de manera menos explícita. ^[1]

Ejemplos

El objetivo y los desafíos del análisis de sentimientos se pueden mostrar a través de algunos ejemplos simples.

Casos simples

Coronet tiene las mejores líneas de cruceros de todo el día.
Bertram tiene un casco en V profunda y navega fácilmente por los mares.
Los cruceros diurnos de colores pastel de los años 80 procedentes de Florida son feos.
No me gustan los viejos cruceros de cabina .

Ejemplos más desafiantes

No me desagradan los cruceros de cabina. ( Manejo de negación )
Que no me gusten las motos acuáticas no es lo mío. (Negación, orden de palabras invertido )
A veces realmente odio las RIB . ( El adverbial modifica el sentimiento)
¡Realmente me encantaría salir con este clima! (Posiblemente sarcástico )
Chris Craft es más guapo que Limestone. (Dos marcas , identificar el objetivo de la actitud es difícil)
Chris Craft tiene mejor apariencia que Limestone, pero Limestone proyecta navegabilidad y confiabilidad. (Dos actitudes, dos marcas)
La película es sorprendente, con muchos giros inquietantes en la trama. (Término negativo utilizado en sentido positivo en ciertos dominios)
Deberías ver su decadente menú de postres. (El término actitudinal ha cambiado de polaridad recientemente en ciertos dominios)
Me encanta mi móvil pero no se lo recomendaría a ninguno de mis compañeros. (Sentimiento positivo matizado, difícil de categorizar)
¡El concierto de la próxima semana será correcto, koide9! ("Quoi de neuf?", que en francés significa "¿qué hay de nuevo?". Los términos recién acuñados pueden ser muy actitudinales, pero de polaridad volátil y, a menudo, fuera del vocabulario conocido).

Tipos

Una tarea básica en el análisis de sentimientos es clasificar la polaridad de un texto determinado a nivel de documento, oración o característica/aspecto, ya sea que la opinión expresada en un documento, una oración o una característica/aspecto de entidad sea positiva, negativa o neutral. La clasificación avanzada de sentimientos "más allá de la polaridad" analiza, por ejemplo, estados emocionales como disfrute, ira, disgusto, tristeza, miedo y sorpresa. ^[2]

Los precursores del análisis sentimental incluyen el General Inquirer, ^[3] que proporcionó pistas para cuantificar patrones en el texto y, por separado, la investigación psicológica que examinó el estado psicológico de una persona basándose en el análisis de su comportamiento verbal. ^[4]

Posteriormente, el método descrito en una patente de Volcani y Fogel ^[5] analizó específicamente los sentimientos e identificó palabras y frases individuales en el texto con respecto a diferentes escalas emocionales. Un sistema actual basado en su trabajo, llamado EffectCheck, presenta sinónimos que pueden usarse para aumentar o disminuir el nivel de emoción evocada en cada escala.

Muchos otros esfuerzos posteriores fueron menos sofisticados y utilizaron una mera visión polar del sentimiento, de positivo a negativo, como el trabajo de Turney, ^[6] y Pang ^[7] , quienes aplicaron diferentes métodos para detectar la polaridad de las reseñas de productos y de películas, respectivamente. . Este trabajo es a nivel de documento. También se puede clasificar la polaridad de un documento en una escala de múltiples vías, lo que intentaron Pang ^[8] y Snyder ^[9], entre otros: Pang y Lee ^[8] ampliaron la tarea básica de clasificar una reseña de película como positiva o negativa. para predecir calificaciones de estrellas en una escala de 3 o 4 estrellas, mientras que Snyder ^[9] realizó un análisis en profundidad de las reseñas de restaurantes, prediciendo calificaciones para varios aspectos del restaurante en cuestión, como la comida y la atmósfera (en una escala de 3 o 4 estrellas). escala de cinco estrellas).

Los primeros pasos para reunir varios enfoques (aprendizaje, léxico, basado en el conocimiento, etc.) se dieron en el Simposio de Primavera de la AAAI de 2004 , donde lingüistas, informáticos y otros investigadores interesados alinearon intereses y propusieron tareas compartidas y conjuntos de datos de referencia para el Investigación computacional sistemática sobre el afecto, el atractivo, la subjetividad y el sentimiento en el texto. ^[10]

Aunque en la mayoría de los métodos de clasificación estadística la clase neutral se ignora bajo el supuesto de que los textos neutrales se encuentran cerca del límite del clasificador binario, varios investigadores sugieren que, como en todo problema de polaridad, se deben identificar tres categorías. Además, se puede demostrar que clasificadores específicos como Max Entropy ^[11] y SVM ^[12] pueden beneficiarse de la introducción de una clase neutral y mejorar la precisión general de la clasificación. En principio, existen dos formas de operar con una clase neutral. O bien, el algoritmo procede identificando primero el lenguaje neutral, filtrándolo y luego evaluando el resto en términos de sentimientos positivos y negativos, o construye una clasificación de tres vías en un solo paso. ^[13] Este segundo enfoque a menudo implica estimar una distribución de probabilidad sobre todas las categorías (por ejemplo, clasificadores ingenuos de Bayes implementados por el NLTK ). El uso y el modo de utilizar una clase neutral depende de la naturaleza de los datos: si los datos están claramente agrupados en lenguaje neutral, negativo y positivo, tiene sentido filtrar el lenguaje neutral y centrarse en la polaridad entre sentimientos positivos y negativos. Si, por el contrario, los datos son en su mayoría neutrales con pequeñas desviaciones hacia el afecto positivo y negativo, esta estrategia haría más difícil distinguir claramente entre los dos polos.

Un método diferente para determinar el sentimiento es el uso de un sistema de escala mediante el cual las palabras comúnmente asociadas con un sentimiento negativo, neutral o positivo reciben un número asociado en una escala de -10 a +10 (de más negativo a más positivo). o simplemente de 0 a un límite superior positivo como +4. Esto hace posible ajustar el sentimiento de un término determinado en relación con su entorno (normalmente al nivel de la oración). Cuando se analiza un fragmento de texto no estructurado mediante procesamiento de lenguaje natural , cada concepto en el entorno especificado recibe una puntuación basada en la forma en que las palabras de sentimiento se relacionan con el concepto y su puntuación asociada. ^[14]^[15]^[16] Esto permite avanzar hacia una comprensión más sofisticada del sentimiento, porque ahora es posible ajustar el valor del sentimiento de un concepto en relación con las modificaciones que pueden rodearlo. Las palabras, por ejemplo, que intensifican, relajan o niegan el sentimiento expresado por el concepto pueden afectar su puntuación. Alternativamente, a los textos se les puede dar una puntuación de intensidad de sentimiento positivo y negativo si el objetivo es determinar el sentimiento en un texto en lugar de la polaridad y la fuerza generales del texto. ^[17]

Existen otros tipos de análisis de sentimientos, como el análisis de sentimientos basado en aspectos, el análisis de sentimientos de calificación (positivo, negativo, neutral), el análisis de sentimientos multilingüe y la detección de emociones.

Identificación subjetividad/objetividad

Esta tarea se define comúnmente como clasificar un texto determinado (generalmente una oración) en una de dos clases: objetiva o subjetiva. ^[18] Este problema a veces puede ser más difícil que la clasificación de polaridad. ^[19] La subjetividad de las palabras y frases puede depender de su contexto y un documento objetivo puede contener oraciones subjetivas (por ejemplo, un artículo de noticias que cita las opiniones de las personas). Además, como menciona Su, ^[20] los resultados dependen en gran medida de la definición de subjetividad utilizada al anotar textos. Sin embargo, Pang ^[21] demostró que eliminar oraciones objetivas de un documento antes de clasificar su polaridad ayudó a mejorar el rendimiento.

Identificación subjetiva y objetiva, subtareas emergentes de análisis de sentimientos para utilizar características sintácticas y semánticas y conocimientos de aprendizaje automático para identificar si una oración o documento contiene hechos u opiniones. La conciencia de reconocer hechos y opiniones no es reciente; posiblemente la presentó por primera vez Carbonell en la Universidad de Yale en 1979. ^{[ aclarar ]}

El término objetivo se refiere al incidente que contiene información fáctica. ^[22]

Ejemplo de frase objetiva: 'Para ser elegido presidente de los Estados Unidos, un candidato debe tener al menos treinta y cinco años de edad'.

El término subjetivo describe el incidente que contiene información no objetiva en diversas formas, como opiniones personales, juicios y predicciones, también conocidos como "estados privados". ^[23] En el ejemplo siguiente, refleja "Nosotros, los estadounidenses" de un estado privado. Además, la entidad objetivo comentada por las opiniones puede adoptar varias formas, desde un producto tangible hasta temas intangibles establecidos en Liu (2010). ^[24] Además, Liu (2010) observó tres tipos de actitudes: 1) opiniones positivas, 2) opiniones neutrales y 3) opiniones negativas. ^[24]

Ejemplo de frase subjetiva: "Nosotros, los estadounidenses, necesitamos elegir un presidente que sea maduro y capaz de tomar decisiones acertadas".

Este análisis es un problema de clasificación. ^[25]

Las colecciones de palabras o indicadores de frases de cada clase se definen para localizar patrones deseables en texto sin anotaciones. Para expresiones subjetivas, se ha creado una lista de palabras diferente. Múltiples investigadores en el campo del procesamiento lingüístico y del lenguaje natural han desarrollado listas de indicadores subjetivos en palabras o frases en Riloff et al. (2003). ^[26] Se debe crear un diccionario de reglas de extracción para medir expresiones dadas. A lo largo de los años, en la detección subjetiva, la extracción de características progresa desde la selección manual de características hasta el aprendizaje automatizado de características. Por el momento, los métodos de aprendizaje automatizado se pueden separar aún más en aprendizaje automático supervisado y no supervisado . Los investigadores académicos han explorado ampliamente la extracción de patrones con proceso de aprendizaje automático en texto anotado y no anotado.

Sin embargo, los investigadores reconocieron varios desafíos en el desarrollo de conjuntos fijos de reglas para expresiones respetables. Gran parte de los desafíos en el desarrollo de reglas provienen de la naturaleza de la información textual. Varios investigadores han reconocido seis desafíos: 1) expresiones metafóricas, 2) discrepancias en los escritos, 3) sensible al contexto, 4) palabras representadas con menos usos, 5) sensible al tiempo y 6) volumen cada vez mayor.

Expresiones metafóricas. El texto contiene expresiones metafóricas que pueden afectar el desempeño en la extracción. ^[27] Además, las metáforas adoptan diferentes formas, lo que puede haber contribuido al aumento de la detección.
Discrepancias en los escritos. Para el texto obtenido de Internet, las discrepancias en el estilo de escritura de los datos del texto objetivo implican distintos géneros y estilos de escritura.
Sensible al contexto. La clasificación puede variar según la subjetividad u objetividad de las oraciones anteriores y siguientes. ^[25]
Atributo urgente. La tarea se ve dificultada por el atributo urgente de algunos datos textuales. Si un grupo de investigadores quiere confirmar un hecho en una noticia, necesita más tiempo para la validación cruzada antes de que la noticia quede obsoleta.
Palabras clave con menos usos.
Volumen cada vez mayor. La tarea también se ve dificultada por el gran volumen de datos textuales. La naturaleza cada vez mayor de los datos textuales hace que la tarea sea abrumadoramente difícil para los investigadores para completarla a tiempo.

Anteriormente, la investigación se centraba principalmente en la clasificación a nivel de documentos. Sin embargo, clasificar un nivel de documento sufre menos precisión, ya que un artículo puede tener diversos tipos de expresiones involucradas. La evidencia de la investigación sugiere un conjunto de artículos de noticias que se espera que dominen por la expresión objetiva, mientras que los resultados muestran que consistió en más del 40% de expresión subjetiva. ^[22]

Para superar esos desafíos, los investigadores concluyen que la eficacia del clasificador depende de la precisión de los patrones que aprende. Y los feeds del alumno con grandes volúmenes de datos de entrenamiento anotados superaron a los entrenados en características subjetivas menos completas. Sin embargo, uno de los principales obstáculos para ejecutar este tipo de trabajo es generar manualmente un gran conjunto de datos de oraciones anotadas. El método de anotación manual ha sido menos favorecido que el aprendizaje automático por tres razones:

Variaciones en las comprensiones. En la tarea de anotación manual, puede haber desacuerdo entre los anotadores sobre si una instancia es subjetiva u objetiva debido a la ambigüedad de los idiomas.
Errores humanos. La tarea de anotación manual es una tarea meticulosa y requiere una intensa concentración para finalizar.
Pérdida de tiempo. La tarea de anotación manual es un trabajo asiduo. Riloff (1996) muestra que 160 textos cuestan 8 horas para que un anotador termine. ^[28]

Todas estas razones mencionadas pueden afectar la eficiencia y eficacia de la clasificación subjetiva y objetiva. En consecuencia, se diseñaron dos métodos de arranque para aprender patrones lingüísticos a partir de datos de texto sin anotaciones. Ambos métodos comienzan con un puñado de palabras iniciales y datos textuales sin anotaciones.

Meta-Bootstrapping de Riloff y Jones en 1999. ^[29] Nivel uno: Generar patrones de extracción basados en las reglas predefinidas y los patrones extraídos por el número de palabras semilla que contiene cada patrón. Nivel dos: las 5 palabras principales se marcarán y se agregarán al diccionario. Repetir.
Basilisk ( Enfoque de arranque para la inducción del léxico semántico utilizando el conocimiento semántico ) por Thelen y Riloff. ^[30] Paso uno: Generar patrones de extracción. Paso dos: mueva los mejores patrones del grupo de patrones al grupo de palabras candidatas. Paso tres: Se marcarán las 10 palabras principales y se agregarán al diccionario. Repetir.

En general, estos algoritmos resaltan la necesidad de reconocimiento y extracción automática de patrones en tareas subjetivas y objetivas.

El clasificador subjetivo y de objetos puede mejorar las diversas aplicaciones del procesamiento del lenguaje natural. Uno de los principales beneficios del clasificador es que popularizó la práctica de procesos de toma de decisiones basados en datos en diversas industrias. Según Liu, las aplicaciones de la identificación subjetiva y objetiva se han implementado en los negocios, la publicidad, los deportes y las ciencias sociales. ^[31]

Clasificación de reseñas en línea: en la industria empresarial, el clasificador ayuda a la empresa a comprender mejor los comentarios sobre el producto y los razonamientos detrás de las reseñas.
Predicción del precio de las acciones: en la industria financiera, el clasificador ayuda al modelo de predicción procesando información auxiliar de las redes sociales y otra información textual de Internet. Estudios anteriores sobre el precio de las acciones japonesas realizados por Dong et al. indica que el modelo con módulo subjetivo y objetivo puede funcionar mejor que aquellos sin esta parte. ^[32]
Análisis de redes sociales.
Clasificación de la retroalimentación de los estudiantes. ^[33]
Resumen de documentos: el clasificador puede extraer comentarios específicos de un objetivo y recopilar opiniones realizadas por una entidad en particular.
Respuesta a preguntas complejas. El clasificador puede analizar las preguntas complejas clasificando el tema del lenguaje o el objetivo objetivo y enfocado. En la investigación Yu et al. (2003), el investigador desarrolló una oración y un documento agrupados que identifican los artículos de opinión. ^[34]
Aplicaciones específicas de dominio.
Análisis de correo electrónico: el clasificador subjetivo y objetivo detecta spam rastreando patrones de lenguaje con palabras objetivo.

Basado en características/aspectos

Se refiere a determinar las opiniones o sentimientos expresados sobre diferentes características o aspectos de entidades, por ejemplo, de un teléfono celular, una cámara digital o un banco. ^[35] Una característica o aspecto es un atributo o componente de una entidad, por ejemplo, la pantalla de un teléfono celular, el servicio de un restaurante o la calidad de imagen de una cámara. La ventaja del análisis de sentimiento basado en características es la posibilidad de capturar matices sobre objetos de interés. Diferentes características pueden generar diferentes sentimientos; por ejemplo, un hotel puede tener una ubicación conveniente, pero una comida mediocre. ^[36] Este problema implica varios subproblemas, por ejemplo, identificar entidades relevantes, extraer sus características/aspectos y determinar si una opinión expresada sobre cada característica/aspecto es positiva, negativa o neutral. ^[37] La identificación automática de características se puede realizar con métodos sintácticos, con modelado de temas , ^[38]^[39] o con aprendizaje profundo . ^[40]^[41] Se pueden encontrar discusiones más detalladas sobre este nivel de análisis de sentimientos en el trabajo de Liu. ^[24]

Clasificación de intensidad

Las emociones y los sentimientos son de naturaleza subjetiva . El grado de emociones/sentimientos expresados en un texto determinado a nivel de documento, oración o característica/aspecto: el grado de intensidad que se expresa en la opinión de un documento, una oración o una entidad difiere según el caso. base. ^[42] Sin embargo, predecir sólo la emoción y el sentimiento no siempre transmite información completa. El grado o nivel de las emociones y sentimientos a menudo juega un papel crucial en la comprensión del sentimiento exacto dentro de una sola clase (por ejemplo, "bueno" versus "impresionante"). Algunos métodos aprovechan un método de conjunto apilado ^[43] para predecir la intensidad de la emoción y el sentimiento combinando los resultados obtenidos y utilizando modelos de aprendizaje profundo basados en redes neuronales convolucionales , ^[44] redes de memoria a corto plazo y unidades recurrentes cerradas . ^[45]

Métodos y características.

Los enfoques existentes para el análisis de sentimientos se pueden agrupar en tres categorías principales: técnicas basadas en el conocimiento, métodos estadísticos y enfoques híbridos. ^[46] Las técnicas basadas en el conocimiento clasifican el texto por categorías afectivas basadas en la presencia de palabras afectivas inequívocas como feliz, triste, asustado y aburrido. ^[47] Algunas bases de conocimiento no sólo enumeran palabras afectivas obvias, sino que también asignan a palabras arbitrarias una probable "afinidad" con emociones particulares. ^[48] Los métodos estadísticos aprovechan elementos del aprendizaje automático como el análisis semántico latente , máquinas de vectores de soporte , " bolsa de palabras ", " información mutua puntual " para la orientación semántica, ^{[6] modelos} de espacio semántico o modelos de incrustación de palabras , ^[49] y aprendizaje profundo . Métodos más sofisticados intentan detectar quién posee un sentimiento (es decir, la persona que mantiene ese estado afectivo) y el objetivo (es decir, la entidad sobre la cual se siente el afecto). ^[50] Para extraer la opinión en contexto y obtener la característica sobre la cual el hablante ha opinado, se utilizan las relaciones gramaticales de las palabras. Las relaciones de dependencia gramatical se obtienen mediante un análisis profundo del texto. ^[51] Los enfoques híbridos aprovechan tanto el aprendizaje automático como elementos de la representación del conocimiento, como ontologías y redes semánticas, para detectar la semántica que se expresa de manera sutil, por ejemplo, a través del análisis de conceptos que no transmiten explícitamente información relevante, pero que están implícitamente vinculados a otros conceptos que también lo hacen. ^[52]

Las herramientas de software de código abierto, así como una variedad de herramientas de análisis de sentimientos gratuitas y de pago, implementan técnicas de aprendizaje automático , estadísticas y procesamiento de lenguaje natural para automatizar el análisis de sentimientos en grandes colecciones de textos, incluidas páginas web, noticias en línea, grupos de discusión en Internet, reseñas en línea, blogs web y redes sociales. ^[53] Los sistemas basados en el conocimiento, por otro lado, hacen uso de recursos disponibles públicamente para extraer la información semántica y afectiva asociada con los conceptos del lenguaje natural. El sistema puede ayudar a realizar un razonamiento afectivo de sentido común . ^[54] El análisis de sentimiento también se puede realizar en contenido visual, es decir, imágenes y vídeos (ver Análisis de sentimiento multimodal ). Uno de los primeros enfoques en esta dirección es SentiBank ^[55] que utiliza una representación de contenido visual de par adjetivo-nombre. Además, la gran mayoría de los enfoques de clasificación de sentimientos se basan en el modelo de bolsa de palabras, que no tiene en cuenta el contexto, la gramática e incluso el orden de las palabras . Los enfoques que analizan el sentimiento basándose en cómo las palabras componen el significado de frases más largas han mostrado mejores resultados, ^[56] pero conllevan una sobrecarga de anotación adicional.

Se requiere un componente de análisis humano en el análisis de sentimientos, ya que los sistemas automatizados no pueden analizar las tendencias históricas del comentarista individual o de la plataforma y, a menudo, se clasifican incorrectamente en el sentimiento expresado. La automatización afecta aproximadamente al 23% de los comentarios que los humanos clasifican correctamente. ^[57] Sin embargo, los humanos a menudo no están de acuerdo, y se argumenta que el acuerdo entre humanos proporciona un límite superior que los clasificadores de sentimientos automatizados pueden eventualmente alcanzar. ^[58]

Evaluación

La precisión de un sistema de análisis de sentimientos es, en principio, qué tan bien concuerda con los juicios humanos. Esto generalmente se mide mediante medidas variantes basadas en la precisión y el recuerdo de las dos categorías objetivo de textos negativos y positivos. Sin embargo, según una investigación, los evaluadores humanos normalmente solo están de acuerdo alrededor del 80% ^[59] de las veces (consulte Confiabilidad entre evaluadores ). Por lo tanto, un programa que logra un 70% de precisión en la clasificación de sentimientos funciona casi tan bien como los humanos, aunque tal precisión pueda no parecer impresionante. Si un programa fuera "correcto" el 100% de las veces, los humanos todavía estarían en desacuerdo con él alrededor del 20% de las veces, ya que están en desacuerdo con cualquier respuesta. ^{[ cita necesaria ]}

Por otro lado, los sistemas informáticos cometen errores muy diferentes a los de los evaluadores humanos y, por tanto, las cifras no son del todo comparables. Por ejemplo, un sistema informático tendrá problemas con negaciones, exageraciones, bromas o sarcasmo, que normalmente son fáciles de manejar para un lector humano: algunos errores que comete un sistema informático le parecerán demasiado ingenuos a un humano. En general, se ha cuestionado la utilidad del análisis de sentimiento para tareas comerciales prácticas, tal como se define en la investigación académica, sobre todo porque el modelo unidimensional simple de sentimiento de negativo a positivo produce bastante poca información procesable para un cliente preocupado por el efecto del discurso público sobre, por ejemplo, la marca o la reputación corporativa. ^[60]^[61]^[62]

Para adaptarse mejor a las necesidades del mercado, la evaluación del análisis de sentimiento se ha trasladado a medidas más basadas en tareas, formuladas junto con representantes de agencias de relaciones públicas y profesionales de investigación de mercado. El enfoque, por ejemplo, en el conjunto de datos de evaluación de RepLab está menos en el contenido del texto bajo consideración y más en el efecto del texto en cuestión sobre la reputación de la marca . ^[63]^[64]^[65]

Debido a que la evaluación del análisis de sentimiento se basa cada vez más en tareas, cada implementación necesita un modelo de entrenamiento independiente para obtener una representación más precisa del sentimiento para un conjunto de datos determinado.

web 2.0

El auge de las redes sociales , como los blogs y las redes sociales, ha alimentado el interés en el análisis de sentimientos. Con la proliferación de reseñas, calificaciones, recomendaciones y otras formas de expresión en línea, la opinión en línea se ha convertido en una especie de moneda virtual para las empresas que buscan comercializar sus productos, identificar nuevas oportunidades y gestionar su reputación. A medida que las empresas buscan automatizar el proceso de filtrar el ruido, comprender las conversaciones, identificar el contenido relevante y actuar de manera adecuada, muchas ahora miran hacia el campo del análisis de sentimientos. ^[66] Para complicar aún más el asunto, está el aumento de plataformas de redes sociales anónimas como 4chan y Reddit . ^[67] Si la web 2.0 se trataba de democratizar la publicación, entonces la siguiente etapa de la web bien podría basarse en democratizar la extracción de datos de todo el contenido que se publica. ^[68]

Un paso hacia este objetivo se logra con la investigación. Actualmente, varios equipos de investigación de universidades de todo el mundo se centran en comprender la dinámica del sentimiento en las comunidades electrónicas a través del análisis del sentimiento. ^[69]

El problema es que la mayoría de los algoritmos de análisis de sentimientos utilizan términos simples para expresar sentimientos sobre un producto o servicio. Sin embargo, los factores culturales, los matices lingüísticos y los diferentes contextos hacen que sea extremadamente difícil convertir una serie de textos escritos en un simple sentimiento a favor o en contra. ^[66] El hecho de que los humanos a menudo no estén de acuerdo sobre el sentimiento del texto ilustra cuán grande es la tarea para las computadoras hacer esto bien. Cuanto más corta es la cadena de texto, más difícil se vuelve.

Aunque las cadenas de texto cortas pueden ser un problema, el análisis de sentimientos dentro del microblogging ha demostrado que Twitter puede verse como un indicador en línea válido del sentimiento político. El sentimiento político de los tuits demuestra una estrecha correspondencia con las posiciones políticas de los partidos y políticos, lo que indica que el contenido de los mensajes de Twitter refleja de manera plausible el panorama político fuera de línea. ^[70] Además, también se ha demostrado que el análisis de sentimientos en Twitter captura el estado de ánimo público detrás de los ciclos de reproducción humana a nivel mundial, ^[71] así como otros problemas de relevancia para la salud pública, como las reacciones adversas a los medicamentos. ^[72]

Si bien el análisis de sentimientos ha sido popular en dominios donde los autores expresan su opinión de manera bastante explícita ("la película es increíble"), como las redes sociales y las reseñas de productos, sólo recientemente se idearon métodos sólidos para otros dominios donde el sentimiento es fuertemente implícito o indirecto. Por ejemplo, en los artículos periodísticos -sobre todo debido a la esperada objetividad periodística- los periodistas suelen describir acciones o acontecimientos en lugar de indicar directamente la polaridad de una información. Los enfoques anteriores que utilizaban diccionarios o funciones superficiales de aprendizaje automático no podían captar el "significado entre líneas", pero recientemente los investigadores han propuesto un enfoque basado en el aprendizaje profundo y un conjunto de datos que es capaz de analizar el sentimiento en los artículos de noticias. ^[1]

Aplicación en sistemas de recomendación.

Para un sistema de recomendación , se ha demostrado que el análisis de sentimientos es una técnica valiosa. Un sistema de recomendación tiene como objetivo predecir la preferencia por un artículo de un usuario objetivo. Los sistemas de recomendación convencionales funcionan con conjuntos de datos explícitos. Por ejemplo, el filtrado colaborativo funciona en la matriz de calificación y el filtrado basado en contenido funciona en los metadatos de los elementos.

En muchos servicios de redes sociales o sitios web de comercio electrónico , los usuarios pueden proporcionar revisiones de texto, comentarios o comentarios sobre los artículos. Estos textos generados por los usuarios proporcionan una rica fuente de opiniones de los usuarios sobre numerosos productos y artículos. Potencialmente, para un artículo, dicho texto puede revelar tanto las características/aspectos relacionados del artículo como los sentimientos de los usuarios sobre cada característica. ^[73] Las características/aspectos del elemento descritos en el texto juegan el mismo papel que los metadatos en el filtrado basado en contenido , pero los primeros son más valiosos para el sistema de recomendación. Dado que los usuarios mencionan ampliamente estas características en sus reseñas, pueden verse como las características más cruciales que pueden influir significativamente en la experiencia del usuario con el artículo, mientras que los metadatos del artículo (generalmente proporcionados por los productores en lugar de los consumidores) puede ignorar características que sean de interés para los usuarios. Para diferentes elementos con características comunes, un usuario puede dar opiniones diferentes. Además, una característica del mismo artículo puede recibir opiniones diferentes de diferentes usuarios. Los sentimientos de los usuarios sobre las funciones pueden considerarse como una puntuación de calificación multidimensional, que refleja su preferencia sobre los elementos.

En función de las características/aspectos y los sentimientos extraídos del texto generado por el usuario, se puede construir un sistema de recomendación híbrido. ^[74] Hay dos tipos de motivación para recomendar un artículo candidato a un usuario. La primera motivación es que el elemento candidato tiene numerosas características comunes con los elementos preferidos del usuario, ^[75] mientras que la segunda motivación es que el elemento candidato recibe un alto sentimiento sobre sus características. Para un artículo preferido, es razonable creer que artículos con las mismas características tendrán una función o utilidad similar. Por lo tanto, es probable que el usuario también prefiera estos elementos. Por otro lado, para una característica compartida de dos elementos candidatos, otros usuarios pueden dar una opinión positiva a uno de ellos y una opinión negativa al otro. Claramente, el artículo con la evaluación más alta debe recomendarse al usuario. Con base en estas dos motivaciones, se puede construir una puntuación de clasificación combinada de similitud y calificación de sentimiento para cada elemento candidato. ^[74]

Excepto por la dificultad del análisis de sentimiento en sí, la aplicación del análisis de sentimiento en reseñas o comentarios también enfrenta el desafío del spam y las reseñas sesgadas. Una dirección de trabajo se centra en evaluar la utilidad de cada revisión. ^[76] Las reseñas o comentarios mal escritos no son útiles para el sistema de recomendación. Además, una reseña puede diseñarse para obstaculizar las ventas de un producto objetivo y, por lo tanto, ser perjudicial para el sistema de recomendación, incluso si está bien escrita.

Los investigadores también descubrieron que las formas largas y cortas de texto generado por el usuario deberían tratarse de manera diferente. Un resultado interesante muestra que las reseñas breves a veces son más útiles que las largas, ^[77] porque es más fácil filtrar el ruido en un texto breve. Para el texto de formato largo, la longitud creciente del texto no siempre trae consigo un aumento proporcional en el número de características o sentimientos del texto.

Lamba y Madhusudhan ^[78] introducen una forma incipiente de satisfacer las necesidades de información de los usuarios de bibliotecas actuales reempaquetando los resultados del análisis de sentimientos de plataformas de medios sociales como Twitter y proporcionándolos como un servicio consolidado basado en el tiempo en diferentes formatos. Además, proponen una nueva forma de realizar marketing en bibliotecas utilizando la minería de redes sociales y el análisis de sentimientos.

Ver también

Referencias

^ ab Hamborg, Félix; Donnay, Karsten (2021). "NewsMTSC: un conjunto de datos para la clasificación de sentimientos dependiente de (múltiples) objetivos en artículos de noticias políticas". "Actas de la 16ª Conferencia del Capítulo Europeo de la Asociación de Lingüística Computacional: Volumen principal"
^ Vong Anh Ho, Duong Huynh-Cong Nguyen, Danh Hoang Nguyen, Linh Thi-Van Pham, Duc-Vu Nguyen, Kiet Van Nguyen, Ngan Luu-Thuy Nguyen. "Reconocimiento de emociones para texto de redes sociales vietnamitas". En Actas de la Conferencia Internacional de 2019 de la Asociación del Pacífico de Lingüística Computacional (PACLING 2019), Hanoi, Vietnam (2019).
^ Stone, Philip J., Dexter C. Dunphy y Marshall S. Smith. "El investigador general: un enfoque informático para el análisis de contenido". Prensa del MIT, Cambridge, MA (1966).
^ Gottschalk, Louis August y Goldine C. Gleser . La medición de estados psicológicos a través del análisis de contenido de la conducta verbal. Prensa de la Universidad de California, 1969.
^ EE.UU. emitió 7.136.877, Volcani, Yanon; & Fogel, David B., "Sistema y método para determinar y controlar el impacto del texto", publicado el 28 de junio de 2001.
^ ab Turney, Peter (2002). "¿Aprobado o desaprobado? Orientación semántica aplicada a la clasificación no supervisada de reseñas". Actas de la Asociación de Lingüística Computacional . págs. 417–424. arXiv : cs.LG/0212032 .
^ Pang, Bo; Lee, Lilian ; Vaithyanathan, Shivakumar (2002). "¿Aprobado? Clasificación de sentimientos mediante técnicas de aprendizaje automático". Actas de la Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP) . págs. 79–86.
^ ab Pang, Bo; Lee, Lilian (2005). "Ver estrellas: explotar las relaciones de clase para la categorización de sentimientos con respecto a escalas de calificación". Actas de la Asociación de Lingüística Computacional (ACL) . págs. 115-124.
^ ab Snyder, Benjamín; Barzilay, Regina (2007). "Clasificación de múltiples aspectos utilizando el algoritmo del buen duelo". Actas del capítulo conjunto de tecnología del lenguaje humano y América del Norte de la Conferencia ACL (HLT-NAACL) . págs. 300–307. Archivado desde el original el 6 de agosto de 2016 . Consultado el 16 de junio de 2009 .
^ Qu, Yan, James Shanahan y Janyce Wiebe . "Explorando la actitud y el afecto en el texto: teorías y aplicaciones". En AAAI Spring Symposium, Informe técnico SS-04-07. Prensa AAAI, Menlo Park, CA. 2004.
^ Vryniotis, Vasilis (2013). La importancia de la clase neutral en el análisis de sentimiento.
^ Koppel, Moshé; Schler, Jonathan (2006). "La importancia de los ejemplos neutrales para aprender el sentimiento". Inteligencia Computacional 22 . págs. 100-109. CiteSeerX 10.1.1.84.9735 .
^ Ribeiro, Filipe Nunes; Araujo, Matheus (2010). "Una comparación de referencia de los métodos de análisis de sentimiento más recientes". Transacciones sobre sistemas informáticos integrados . 9 (4).
^ Taboada, Maite; Brooke, Julián (2011). "Métodos basados en léxico para el análisis de sentimientos". Ligüística computacional . 37 (2): 272–274. CiteSeerX 10.1.1.188.5517 . doi :10.1162/coli_a_00049. S2CID 3181362.
^ Augustyniak, Łukasz; Szymanski, Piotr; Kajdanowicz, Tomasz; Tuligłowicz, Włodzimierz (25 de diciembre de 2015). "Estudio integral sobre el análisis de sentimientos de clasificación por conjuntos basado en léxico". Entropía . 18 (1): 4. Bibcode : 2015Entrp..18....4A. doi : 10.3390/e18010004 .
^ Mehmood, Yasir; Balakrishnan, Vimala (1 de enero de 2020). "Un enfoque mejorado basado en léxico para el análisis de sentimientos: un estudio de caso sobre inmigración ilegal". Revisión de información en línea . 44 (5): 1097-1117. doi :10.1108/OIR-10-2018-0295. ISSN 1468-4527. S2CID 221766042.
^ Thelwall, Mike; Buckley, Kevan; Paltoglou, Georgios; Cai, Di; Kappas, Arvid (2010). "Detección de la fuerza del sentimiento en un texto breve informal". Revista de la Sociedad Estadounidense de Ciencia y Tecnología de la Información . 61 (12): 2544–2558. CiteSeerX 10.1.1.278.3863 . doi :10.1002/asi.21416.
^ Pang, Bo; Lee, Lilian (2008). "4.1.2 Detección de subjetividad e identificación de opiniones". Minería de opiniones y análisis de sentimiento . Ahora Publishers Inc.
^ Mihalcea, Rada; Banea, Carmen; Wiebe, Janyce (2007). "Aprendizaje de un lenguaje subjetivo multilingüe mediante proyecciones interlingües" (PDF) . Actas de la Asociación de Lingüística Computacional (ACL) . págs. 976–983. Archivado desde el original (PDF) el 8 de julio de 2010.
^ Su, Fangzhong; Markert, Katja (2008). "De las palabras a los sentidos: un estudio de caso sobre el reconocimiento de la subjetividad" (PDF) . Actas de Coling 2008, Manchester, Reino Unido .
^ Pang, Bo; Lee, Lilian (2004). "Una educación sentimental: análisis de sentimientos mediante resumen de subjetividad basado en recortes mínimos". Actas de la Asociación de Lingüística Computacional (ACL) . págs. 271–278.
^ ab Wiebe, Janyce ; Riloff, Ellen (2005). "Creación de clasificadores de oraciones subjetivas y objetivas a partir de textos sin anotaciones". En Gelbukh, Alexander (ed.). Lingüística Computacional y Procesamiento Inteligente de Textos . Apuntes de conferencias sobre informática. vol. 3406. Berlín, Heidelberg: Springer. págs. 486–497. doi :10.1007/978-3-540-30586-6_53. ISBN 978-3-540-30586-6.
^ Peculiaridad, Randolph; Greenbaum, Sidney; Geoffrey, sanguijuela; Enero, Svartvik (1985). Una gramática integral del idioma inglés (gramática general) . Longman . págs. 175-239. ISBN 1933108312.
^ abc Liu, Bing (2010). «Análisis de Sentimientos y Subjetividad» (PDF) . En Indurkhya, N.; Damerau, FJ (eds.). Manual de procesamiento del lenguaje natural (Segunda ed.).
^ ab Pang, Bo; Lee, Lillian (6 de julio de 2008). "Minería de opiniones y análisis de sentimientos". Fundamentos y tendencias en la recuperación de información . 2 (1–2): 1–135. doi :10.1561/1500000011. ISSN 1554-0669. S2CID 207178694.
^ Riloff, Ellen; Wiebe, Janyce (11 de julio de 2003). "Aprendizaje de patrones de extracción de expresiones subjetivas". Actas de la conferencia de 2003 sobre métodos empíricos en el procesamiento del lenguaje natural - . EMNLP '03. vol. 10. Estados Unidos: Asociación de Lingüística Computacional. págs. 105-112. doi : 10.3115/1119355.1119369 . S2CID 6541910.
^ Wiebe, Janyce ; Riloff, Ellen (julio de 2011). "Encontrar un beneficio mutuo entre el análisis de subjetividad y la extracción de información". Transacciones IEEE sobre informática afectiva . 2 (4): 175–191. doi :10.1109/T-AFFC.2011.19. ISSN 1949-3045. S2CID 16820846.
^ Riloff, Ellen (1 de agosto de 1996). "Un estudio empírico de la construcción automatizada de diccionarios para la extracción de información en tres dominios". Inteligencia artificial . 85 (1): 101-134. doi : 10.1016/0004-3702(95)00123-9 . ISSN 0004-3702.
^ Riloff, Ellen; Jones, Rosie (julio de 1999). "Diccionarios de aprendizaje para extracción de información mediante bootstrapping multinivel" (PDF) . AAAI '99/IAAI '99: Actas de la Decimosexta Conferencia Nacional sobre Inteligencia Artificial y la Undécima Conferencia sobre Aplicaciones Innovadoras de Inteligencia Artificial Aplicaciones Innovadoras de la Inteligencia Artificial : 474–479.
^ Thelen, Michael; Riloff, Ellen (6 de julio de 2002). "Un método de arranque para aprender léxicos semánticos utilizando contextos de patrones de extracción". Actas de la conferencia ACL-02 sobre métodos empíricos en el procesamiento del lenguaje natural - EMNLP '02 . vol. 10. Estados Unidos: Asociación de Lingüística Computacional. págs. 214-221. doi : 10.3115/1118693.1118721 . S2CID 137155. {{cite book}}: |journal=ignorado ( ayuda )
^ Liu, Bing (23 de mayo de 2012). "Análisis de sentimientos y minería de opiniones". Conferencias de síntesis sobre tecnologías del lenguaje humano . 5 (1): 1–167. doi :10.2200/S00416ED1V01Y201204HLT016. ISSN 1947-4040. S2CID 38022159. Archivado desde el original el 10 de mayo de 2021 . Consultado el 9 de diciembre de 2020 .
^ Deng, Shangkun; Mitsubuchi, Takashi; Shioda, Kei; Shimada, Tatsuro; Sakurai, Akito (diciembre de 2011). "Combinación del análisis técnico con el análisis de sentimiento para la predicción del precio de las acciones". 2011 Novena Conferencia Internacional del IEEE sobre Computación Confiable, Autónoma y Segura . IEEE. págs. 800–807. doi :10.1109/dasc.2011.138. ISBN 978-1-4673-0006-3. S2CID 15262023.
^ Nguyen, Kiet Van; Nguyen, Vu Duc; Nguyen, Phu XV; Truong, Tham TH; Nguyen, Ngan LT. (1 de octubre de 2018). "UIT-VSFC: corpus de comentarios de estudiantes vietnamitas para el análisis de sentimientos". 2018 10° Congreso Internacional sobre Conocimiento e Ingeniería de Sistemas (KSE) . Vietnam: IEEE. págs. 19-24. doi :10.1109/KSE.2018.8573337. ISBN 978-1-5386-6113-0. S2CID 56172224.
^ Yu, Hong; Hatzivassiloglou, Vasileios (11 de julio de 2003). "Hacia la respuesta a preguntas de opinión". Actas de la conferencia de 2003 sobre métodos empíricos en el procesamiento del lenguaje natural - . EMNLP '03. vol. 10. Estados Unidos: Asociación de Lingüística Computacional. págs. 129-136. doi : 10.3115/1119355.1119372 .
^ Hu, Minqing; Liu, Bing (2004). "Extracción y resumen de opiniones de clientes". Actas de KDD 2004 .
^ Cataldi, Mario; Ballatore, Andrea; Tiddi, Ilaria; Aufaure, Marie-Aude (22 de junio de 2013). "Buena ubicación, comida terrible: detección de opiniones sobre funciones en reseñas generadas por usuarios". Análisis y Minería de Redes Sociales . 3 (4): 1149-1163. CiteSeerX 10.1.1.396.9313 . doi :10.1007/s13278-013-0119-7. ISSN 1869-5450. S2CID 5025282.
^ Liu, Bing; Hu, Minqing; Cheng, Junsheng (2005). "Opinion Observer: análisis y comparación de opiniones en la Web". Actas de WWW 2005 .
^ Zhai, Zhongwu; Liu, Bing; Xu, Hua; Jia, Peifa (1 de enero de 2011). "LDA restringida para agrupar características de productos en minería de opiniones". En Huang, Joshua Zhexue; Cao, Longbing; Srivastava, Jaideep (eds.). Avances en descubrimiento de conocimiento y minería de datos . Apuntes de conferencias sobre informática. vol. 6634. Springer Berlín Heidelberg. págs. 448–459. CiteSeerX 10.1.1.221.5178 . doi :10.1007/978-3-642-20841-6_37. ISBN 978-3-642-20840-9.
^ Titov, Iván; McDonald, Ryan (1 de enero de 2008). "Modelado de reseñas en línea con modelos de temas multigrano". Actas de la 17ª conferencia internacional sobre la World Wide Web . WWW'08. Nueva York, NY, Estados Unidos: ACM. págs. 111-120. arXiv : 0801.1063 . doi :10.1145/1367497.1367513. ISBN 978-1-60558-085-2. S2CID 13609860.
^ Liang, contenedor; et al. (2022). "Análisis de sentimiento basado en aspectos a través de redes convolucionales de gráficos mejorados de conocimiento afectivo". Sistemas basados en el conocimiento . 235 : 107643. doi : 10.1016/j.knosys.2021.107643. S2CID 237258427.
^ Mamá, Yukun; et al. (2018). "Análisis de sentimiento basado en aspectos dirigido mediante la incorporación de conocimientos de sentido común en un LSTM atento". Actas de AAAI . págs. 5876–5883.
^ Sharma, Raksha; somaní; Kumar; Bhattacharyya (2017). "Clasificación de la intensidad del sentimiento entre adjetivos que utilizan incrustaciones de palabras que contienen sentimientos" (PDF) . Asociación de Lingüística Computacional : 547–552.
^ MS Akhtar, A. Ekbal y E. Cambria, "¿Qué tan intenso eres? Predecir intensidades de emociones y sentimientos utilizando Stacked Ensemble [Notas de aplicación]", en IEEE Computational Intelligence Magazine , vol. 15, núm. 1, págs. 64-75, febrero de 2020, doi: 10.1109/MCI.2019.2954667.
^ X. Ouyang, P. Zhou, CH Li y L. Liu, "Análisis de sentimientos mediante redes neuronales convolucionales", Conferencia internacional IEEE de 2015 sobre informática y tecnología de la información; Computación y Comunicaciones Ubicuas; Computación confiable, autónoma y segura; Inteligencia y computación generalizadas, 2015, págs. 2359-2364, doi: 10.1109/CIT/IUCC/DASC/PICOM.2015.349.
^ Y. Santur, "Análisis de sentimientos basado en una unidad recurrente cerrada", Simposio internacional de procesamiento de datos e inteligencia artificial (IDAP) de 2019, 2019, págs. 1-5, doi: 10.1109/IDAP.2019.8875985.
^ Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). "Nuevas vías en la minería de opiniones y el análisis de sentimientos". Sistemas inteligentes IEEE . 28 (2): 15-21. CiteSeerX 10.1.1.688.1384 . doi :10.1109/MIS.2013.30. S2CID 12104996.
^ Ortony, Andrés; Clore, G; Collins, A (1988). La estructura cognitiva de las emociones (PDF) . Universidad de Cambridge. Prensa. Archivado desde el original (PDF) el 23 de noviembre de 2015.
^ Stevenson, Ryan; Mikels, José; James, Thomas (2007). "Caracterización de las normas afectivas de palabras en inglés por categorías emocionales discretas". Métodos de investigación del comportamiento . 39 (4): 1020–1024. doi : 10.3758/bf03192999 . PMID 18183921. S2CID 6673690.
^ Sahlgren, Magnus ; Karlgren, Jussi; Eriksson, Gunnar (2007). "Anotación de valencia basada en semillas en el espacio de palabras". Actas del Cuarto Taller Internacional sobre Evaluaciones Semánticas (SemEval-2007) .
^ Kim, SM; Hovy, EH (2006). "Identificación y análisis de opiniones de sentencia". (PDF) . Actas de la conferencia sobre tecnología del lenguaje humano / Asociación Norteamericana de Lingüística Computacional (HLT-NAACL 2006). Nueva York, NY . Archivado desde el original (PDF) el 29 de junio de 2011.
^ Dey, Lipika; Haque, SK Mirajul (2008). "Minería de opiniones a partir de datos de texto ruidosos". Actas del segundo taller sobre análisis de datos de texto no estructurados ruidosos, páginas 83-90 .
^ Cambria, E; Hussain, A (2015). Computación sentic: un marco basado en el sentido común para el análisis de sentimientos a nivel de concepto. Saltador. ISBN 9783319236544.
^ Akcora, Cuneyt Gurcan; Bayir, Murat Ali; Demirbas, Murat; Ferhatosmanoglu, Hakan (2010). "Identificar puntos de ruptura en la opinión pública". SigKDD, Actas del primer taller sobre análisis de redes sociales .
^ Cambria, Erik; Liu, Qian; Decherchi, Sergio; Xing, Frank; Kwok, Kenneth (2022). "SenticNet 7: un marco de IA neurosimbólica basado en el sentido común para un análisis de sentimientos explicable" (PDF) . Actas de LREC . págs. 3829–3839.
^ Borth, Damián; Ji, Rongrong; Chen, Tao; Breuel, Thomas; Chang, Shih-Fu (2013). "Detectores y ontología de sentimiento visual a gran escala que utilizan pares de sustantivos adjetivos". Actas de ACM Int. Jornada sobre Multimedia . págs. 223-232. Archivado desde el original el 15 de abril de 2021 . Consultado el 2 de noviembre de 2017 .
^ Socher, Richard; Perelygin, Alex; Wu, Jean Y.; Chuang, Jason; Manning, Christopher D.; Ng, Andrés Y.; Potts, Christopher (2013). "Modelos profundos recursivos para la composicionalidad semántica sobre un banco de sentimientos". En Actas de EMNLP : 1631-1642. CiteSeerX 10.1.1.593.7427 .
^ "Estudio de caso: análisis de sentimiento avanzado". Archivado desde el original el 29 de octubre de 2013 . Consultado el 18 de octubre de 2013 .
^ Mozetič, Igor; Grčar, Miha; Smailović, Jasmina (5 de mayo de 2016). "Clasificación multilingüe de sentimientos de Twitter: el papel de los anotadores humanos". MÁS UNO . 11 (5): e0155036. arXiv : 1602.07563 . Código Bib : 2016PLoSO..1155036M. doi : 10.1371/journal.pone.0155036 . ISSN 1932-6203. PMC 4858191 . PMID 27149621.
^ Ogneva, M. "Cómo las empresas pueden utilizar el análisis de sentimientos para mejorar sus negocios". Machacable . Consultado el 13 de diciembre de 2012 .
^ Karlgren, Jussi , Magnus Sahlgren , Fredrik Olsson, Fredrik Espinoza y Ola Hamfors. "Utilidad del análisis de sentimientos". En Conferencia europea sobre recuperación de información, págs. 426-435. Springer Berlín Heidelberg, 2012.
^ Karlgren, Jussi . "La relación entre el estado de ánimo del autor y el afecto en el texto y el género del texto". En Actas del cuarto taller sobre explotación de anotaciones semánticas en la recuperación de información, págs. 9-10. ACM, 2011.
^ Karlgren, Jussi . "El afecto, el atractivo y el sentimiento como factores que influyen en la interacción con la información multimedia". En Actas del taller Theseus/ImageCLEF sobre evaluación de recuperación de información visual, págs. 8-11. 2009.
↑ Amigó, Enrique, Adolfo Corujo, Julio Gonzalo, Edgar Meij y Maarten de Rijke . "Descripción general de RepLab 2012: Evaluación de sistemas de gestión de reputación en línea". En CLEF (Notas de trabajo/laboratorios/taller en línea). 2012.
^ Amigó, Enrique, Jorge Carrillo De Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Tamara Martín, Edgar Meij, Maarten de Rijke y Damiano Spina. "Descripción general de replab 2013: evaluación de los sistemas de seguimiento de la reputación online". En Conferencia Internacional del Foro de Evaluación Interlingüística de Lenguas Europeas, págs. 333-352. Springer Berlín Heidelberg, 2013.
^ Amigó, Enrique, Jorge Carrillo-de-Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Edgar Meij, Maarten de Rijke y Damiano Spina. "Descripción general de replab 2014: perfiles de autor y dimensiones de reputación para la gestión de la reputación en línea". En Conferencia Internacional del Foro de Evaluación Interlingüística de Lenguas Europeas, págs. 307-322. Publicaciones internacionales Springer, 2014.
^ ab Wright, Alex. "Exploración de la Web en busca de sentimientos, no de hechos", New York Times , 23 de agosto de 2009. Recuperado el 1 de octubre de 2009.
^ "Análisis de sentimiento en Reddit". 30 de septiembre de 2014 . Consultado el 10 de octubre de 2014 .
^ Kirkpatrick, Marshall. ", ReadWriteWeb , 15 de abril de 2009. Consultado el 1 de octubre de 2009.
^ Condliffe, Jamie. "Las llamas impulsan las redes sociales en línea", New Scientist , 7 de diciembre de 2010. Recuperado el 13 de diciembre de 2010.
^ Tumasjan, Andranik; O. Sprenger, Timm; G. Sandner, Philipp; M. Welpe, Isabell (2010). "Predecir elecciones con Twitter: lo que revelan 140 caracteres sobre el sentimiento político" Archivado el 12 de diciembre de 2020 en Wayback Machine . "Actas de la Cuarta Conferencia Internacional AAAI sobre Weblogs y Redes Sociales"
^ Madera, Ian B.; Varela, Pedro L.; Bollen, Johan; Rocha, Luis M.; Gonçalves-Sá, Joana (2017). "Los ciclos sexuales humanos están impulsados por la cultura y coinciden con los estados de ánimo colectivos". Informes científicos . 7 (1): 17973. arXiv : 1707.03959 . Código Bib : 2017NatSR...717973W. doi :10.1038/s41598-017-18262-5. PMC 5740080 . PMID 29269945.
^ Korkontzelos, Ioannis; Nikfarjam, Azadeh; Shardlow, Mateo; Sarker, Abeed; Ananiadou, Sofía; González, Graciela H. (2016). "Análisis del efecto del análisis de sentimiento en la extracción de reacciones adversas a medicamentos de tweets y publicaciones en foros". Revista de Informática Biomédica . 62 : 148-158. doi :10.1016/j.jbi.2016.06.007. PMC 4981644 . PMID 27363901.
^ Tang, Huifeng; Tan, Songbo; Cheng, Xueqi (2009). "Una encuesta sobre la detección de opiniones en las reseñas" (PDF) . Sistemas Expertos con Aplicaciones . 36 (7): 10760–10773. doi :10.1016/j.eswa.2009.02.063. S2CID 2178380. Archivado desde el original (PDF) el 24 de mayo de 2018.
^ ab Jakob, Niklas y col. "Más allá de las estrellas: explotar las reseñas de usuarios en texto libre para mejorar la precisión de las recomendaciones de películas". Actas del primer taller internacional del CIKM sobre análisis de sentimiento y tema para la opinión de masas . ACM, 2009.
^ Minqing, Hu; Liu, Bing (2004). "Funciones de opinión minera en las reseñas de los clientes" (PDF) . AAAI . 4 (4). S2CID 5724860. Archivado desde el original (PDF) el 24 de mayo de 2018.
^ Liu, Yang; Huang, Xiangji; An, Aijun; Yu, Xiaohui (2008). "Modelado y predicción de la utilidad de las reseñas en línea" (PDF) . ICDM'08. Octava conferencia internacional IEEE sobre minería de datos . IEEE. págs. 443–452. doi :10.1109/ICDM.2008.94. ISBN 978-0-7695-3502-9. S2CID 18235238.
^ Bermingham, Adán; Smeaton, Alan F. (2010). "Clasificación del sentimiento en los microblogs". Actas de la 19ª conferencia internacional ACM sobre gestión de la información y el conocimiento (PDF) . págs. 1833–1836. doi :10.1145/1871437.1871741. ISBN 9781450300995. S2CID 2084603.{{cite book}}: Mantenimiento CS1: fecha y año ( enlace )
^ Lamba, Manika; Madhusudhan, Margam (2018). "Aplicación del análisis de sentimiento en bibliotecas para brindar servicio de información temporal: un estudio de caso sobre diversas facetas de la productividad". Análisis y Minería de Redes Sociales . 8 (1): 1–12. doi :10.1007/s13278-018-0541-y. S2CID 53047128.