Análisis de sentimientos

El análisis de sentimientos (también conocido como minería de opiniones o inteligencia artificial de emociones ) es el uso del procesamiento del lenguaje natural , el análisis de texto , la lingüística computacional y la biometría para identificar, extraer, cuantificar y estudiar sistemáticamente los estados afectivos y la información subjetiva. El análisis de sentimientos se aplica ampliamente a los materiales de voz del cliente , como reseñas y respuestas de encuestas, medios sociales y en línea, y materiales de atención médica para aplicaciones que van desde el marketing hasta el servicio al cliente y la medicina clínica. Con el auge de los modelos de lenguaje profundo, como RoBERTa , también se pueden analizar dominios de datos más difíciles, por ejemplo, textos de noticias donde los autores suelen expresar su opinión/sentimiento de forma menos explícita. ^[1]

Casos sencillos

Coronet tiene las mejores líneas de cruceros de día completo.
Bertram tiene un casco en forma de V profunda y navega con facilidad por los mares.
Los cruceros diurnos de color pastel de los años 80 procedentes de Florida son feos.
No me gustan los viejos cruceros de cabina .

Ejemplos más desafiantes

No me desagradan los cruceros de cabina. ( Manejo de negaciones )
No me gusta odiar las embarcaciones. (Negación, orden de palabras invertido )
A veces odio los RIB . ( El adverbio modifica el sentimiento)
¡Me encantaría salir con este clima! (Posiblemente sarcástico )
Chris Craft es más atractivo que Limestone. (Dos marcas , identificar el objetivo de la actitud es difícil)
Chris Craft es más atractivo que Limestone, pero Limestone proyecta navegabilidad y fiabilidad. (Dos actitudes, dos marcas)
La película es sorprendente, con muchos giros de trama inquietantes. (Término negativo utilizado en sentido positivo en ciertos ámbitos)
Deberías ver su decadente menú de postres. (El término actitudinal ha cambiado de polaridad recientemente en ciertos ámbitos)
Me encanta mi móvil, pero no se lo recomendaría a ninguno de mis compañeros. (Sentimiento positivo calificado, difícil de categorizar)
El concierto de la próxima semana será en koide9! ("Quoi de neuf?", en francés significa "¿qué hay de nuevo?". Los términos recién acuñados pueden ser muy actitudinales pero volátiles en polaridad y, a menudo, fuera del vocabulario conocido).

Tipos

Una tarea básica en el análisis de sentimientos es clasificar la polaridad de un texto determinado a nivel de documento, oración o característica/aspecto: si la opinión expresada en un documento, una oración o una característica/aspecto de una entidad es positiva, negativa o neutral. La clasificación avanzada de sentimientos "más allá de la polaridad" analiza, por ejemplo, estados emocionales como el disfrute, la ira, el disgusto, la tristeza, el miedo y la sorpresa. ^[2]

Entre los precursores del análisis sentimental se incluyen el General Inquirer, ^{[3] que proporcionó pistas para cuantificar patrones en el texto y, por separado, la investigación psicológica que examinó}el estado psicológico de una persona basándose en el análisis de su comportamiento verbal. ^[4]

Posteriormente, el método descrito en una patente de Volcani y Fogel ^[5] se centró específicamente en el sentimiento e identificó palabras y frases individuales en el texto con respecto a diferentes escalas emocionales. Un sistema actual basado en su trabajo, llamado EffectCheck, presenta sinónimos que se pueden utilizar para aumentar o disminuir el nivel de emoción evocada en cada escala.

Muchos otros esfuerzos posteriores fueron menos sofisticados, utilizando una mera visión polar del sentimiento, de positivo a negativo, como el trabajo de Turney, ^[6] y Pang ^[7] que aplicaron diferentes métodos para detectar la polaridad de las críticas de productos y críticas de películas respectivamente. Este trabajo se realiza a nivel de documento. También se puede clasificar la polaridad de un documento en una escala de múltiples vías, lo que intentaron Pang ^[8] y Snyder ^[9] entre otros: Pang y Lee ^[8] ampliaron la tarea básica de clasificar una crítica de película como positiva o negativa para predecir calificaciones de estrellas en una escala de 3 o 4 estrellas, mientras que Snyder ^[9] realizó un análisis en profundidad de las críticas de restaurantes, prediciendo calificaciones para varios aspectos del restaurante en cuestión, como la comida y la atmósfera (en una escala de cinco estrellas).

Los primeros pasos para reunir diversos enfoques (de aprendizaje, léxicos, basados en el conocimiento, etc.) se dieron en el Simposio de Primavera de la AAAI de 2004 , donde lingüistas, científicos informáticos y otros investigadores interesados alinearon por primera vez sus intereses y propusieron tareas compartidas y conjuntos de datos de referencia para la investigación computacional sistemática sobre el afecto, el atractivo, la subjetividad y el sentimiento en el texto. ^[10]

Aunque en la mayoría de los métodos de clasificación estadística se ignora la clase neutral bajo el supuesto de que los textos neutrales se encuentran cerca del límite del clasificador binario, varios investigadores sugieren que, como en todo problema de polaridad, se deben identificar tres categorías. Además, se puede demostrar que clasificadores específicos como Max Entropy ^[11] y SVMs ^[12] pueden beneficiarse de la introducción de una clase neutral y mejorar la precisión general de la clasificación. En principio, hay dos formas de operar con una clase neutral. O bien, el algoritmo procede primero identificando el idioma neutral, filtrándolo y luego evaluando el resto en términos de sentimientos positivos y negativos, o construye una clasificación de tres vías en un solo paso. ^[13] Este segundo enfoque a menudo implica estimar una distribución de probabilidad sobre todas las categorías (por ejemplo, clasificadores Bayes ingenuos como los implementados por NLTK ). Si se usa o no una clase neutral depende de la naturaleza de los datos: si los datos están claramente agrupados en idioma neutral, negativo y positivo, tiene sentido filtrar el idioma neutral y centrarse en la polaridad entre los sentimientos positivos y negativos. Si, por el contrario, los datos son en su mayoría neutrales, con pequeñas desviaciones hacia los afectos positivos y negativos, esta estrategia haría más difícil distinguir claramente entre los dos polos.

Un método diferente para determinar el sentimiento es el uso de un sistema de escala mediante el cual a las palabras comúnmente asociadas con tener un sentimiento negativo, neutral o positivo se les asigna un número asociado en una escala de −10 a +10 (más negativo hasta más positivo) o simplemente de 0 a un límite superior positivo como +4. Esto hace posible ajustar el sentimiento de un término dado en relación con su entorno (generalmente en el nivel de la oración). Cuando se analiza un fragmento de texto no estructurado utilizando el procesamiento del lenguaje natural , a cada concepto en el entorno especificado se le asigna una puntuación basada en la forma en que las palabras de sentimiento se relacionan con el concepto y su puntuación asociada. ^[14]^[15] Esto permite el movimiento hacia una comprensión más sofisticada del sentimiento, porque ahora es posible ajustar el valor de sentimiento de un concepto en relación con las modificaciones que pueden rodearlo. Las palabras, por ejemplo, que intensifican, relajan o niegan el sentimiento expresado por el concepto pueden afectar su puntuación. Alternativamente, a los textos se les puede dar una puntuación de fuerza de sentimiento positiva y negativa si el objetivo es determinar el sentimiento en un texto en lugar de la polaridad y fuerza generales del texto. ^[16]

Existen otros tipos de análisis de sentimientos, como el análisis de sentimientos basado en aspectos, el análisis de sentimientos con clasificación (positiva, negativa, neutral), el análisis de sentimientos multilingüe y la detección de emociones.

Identificación subjetividad/objetividad

Esta tarea se define comúnmente como la clasificación de un texto dado (normalmente una oración) en una de dos clases: objetivo o subjetivo. ^[17] Este problema a veces puede ser más difícil que la clasificación por polaridad. ^[18] La subjetividad de las palabras y frases puede depender de su contexto y un documento objetivo puede contener oraciones subjetivas (por ejemplo, un artículo de noticias que cita las opiniones de la gente). Además, como menciona Su, ^[19] los resultados dependen en gran medida de la definición de subjetividad utilizada al anotar textos. Sin embargo, Pang ^[20] demostró que eliminar oraciones objetivas de un documento antes de clasificar su polaridad ayudó a mejorar el rendimiento.

Identificación subjetiva y objetiva, subtareas emergentes del análisis de sentimientos que utilizan características sintácticas y semánticas y conocimientos de aprendizaje automático para identificar si una oración o documento contiene hechos u opiniones. La conciencia de reconocer hechos y opiniones no es reciente, posiblemente presentada por primera vez por Carbonell en la Universidad de Yale en 1979. ^{[ aclarar ]}

El término objetivo se refiere al incidente que contiene información fáctica. ^[21]

Ejemplo de oración objetiva: 'Para ser elegido presidente de los Estados Unidos, un candidato debe tener al menos treinta y cinco años de edad'.

El término subjetivo describe el incidente que contiene información no fáctica en varias formas, como opiniones personales, juicios y predicciones, también conocidas como "estados privados". ^[22] En el ejemplo que se muestra a continuación, refleja un estado privado "Nosotros, los estadounidenses". Además, la entidad objetivo comentada por las opiniones puede adoptar varias formas, desde un producto tangible hasta temas intangibles, como se indica en Liu (2010). ^[23] Además, Liu (2010) observó tres tipos de actitudes: 1) opiniones positivas, 2) opiniones neutrales y 3) opiniones negativas. ^[23]

Ejemplo de una oración subjetiva: “Los estadounidenses necesitamos elegir un presidente que sea maduro y capaz de tomar decisiones sabias”.

Este análisis es un problema de clasificación. ^[24]

Las colecciones de indicadores de palabras o frases de cada clase se definen para localizar patrones deseables en texto no anotado. Para la expresión subjetiva, se ha creado una lista de palabras diferente. Múltiples investigadores en el campo de la lingüística y el procesamiento del lenguaje natural han desarrollado listas de indicadores subjetivos en palabras o frases, como afirma Riloff et al. (2003). ^[25] Se debe crear un diccionario de reglas de extracción para medir expresiones dadas. A lo largo de los años, en la detección subjetiva, la extracción de características progresó desde la curación de características a mano hasta el aprendizaje automático de características. En la actualidad, los métodos de aprendizaje automático pueden separarse aún más en aprendizaje automático supervisado y no supervisado . La extracción de patrones con el proceso de aprendizaje automático de texto anotado y no anotado ha sido explorada ampliamente por investigadores académicos.

Sin embargo, los investigadores reconocieron varios desafíos en el desarrollo de conjuntos fijos de reglas para expresiones respetables. Gran parte de los desafíos en el desarrollo de reglas se derivan de la naturaleza de la información textual. Varios investigadores han reconocido seis desafíos: 1) expresiones metafóricas, 2) discrepancias en los escritos, 3) sensibilidad al contexto, 4) palabras representadas con menos usos, 5) sensibilidad al tiempo y 6) volumen cada vez mayor.

Expresiones metafóricas. El texto que contiene expresiones metafóricas puede tener un impacto en el rendimiento de la extracción. ^[26] Además, las metáforas adoptan diferentes formas, lo que puede haber contribuido al aumento de la detección.
Discrepancias en los textos. En el caso de los textos obtenidos de Internet, las discrepancias en el estilo de redacción de los datos textuales de referencia se deben a distintos géneros y estilos de escritura.
Sensible al contexto. La clasificación puede variar en función de la subjetividad u objetividad de las oraciones anteriores y posteriores. ^[24]
Atributo de sensibilidad temporal. La tarea se ve desafiada por el atributo de sensibilidad temporal de algunos datos textuales. Si un grupo de investigadores quiere confirmar un dato de las noticias, necesita más tiempo para la validación cruzada, de modo que las noticias queden obsoletas.
Palabras clave con menos usos.
Volumen en constante crecimiento. La tarea también se ve desafiada por el gran volumen de datos textuales. La naturaleza cada vez mayor de los datos textuales hace que sea extremadamente difícil para los investigadores completar la tarea a tiempo.

Anteriormente, la investigación se centraba principalmente en la clasificación a nivel de documento. Sin embargo, la clasificación a nivel de documento es menos precisa, ya que un artículo puede tener diversos tipos de expresiones involucradas. La evidencia de la investigación sugiere un conjunto de artículos de noticias en los que se espera que predomine la expresión objetiva, mientras que los resultados muestran que consistía en más del 40% de expresión subjetiva. ^[21]

Para superar estos desafíos, los investigadores concluyen que la eficacia del clasificador depende de la precisión de los patrones que aprende el alumno. Y el aprendizaje alimentado con grandes volúmenes de datos de entrenamiento anotados superó a los entrenados con características subjetivas menos completas. Sin embargo, uno de los principales obstáculos para ejecutar este tipo de trabajo es generar un gran conjunto de datos de oraciones anotadas manualmente. El método de anotación manual ha sido menos favorecido que el aprendizaje automático por tres razones:

Variaciones en la comprensión. En la tarea de anotación manual, puede haber desacuerdo entre los anotadores sobre si una instancia es subjetiva u objetiva debido a la ambigüedad de los idiomas.
Errores humanos. La tarea de anotación manual es una tarea meticulosa que requiere una concentración intensa para finalizarla.
Requiere mucho tiempo. La tarea de anotación manual es un trabajo arduo. Riloff (1996) demuestra que 160 textos requieren 8 horas para que un anotador los complete. ^[27]

Todas estas razones mencionadas pueden afectar la eficiencia y la eficacia de la clasificación subjetiva y objetiva. Por consiguiente, se diseñaron dos métodos de arranque para aprender patrones lingüísticos a partir de datos de texto sin anotaciones. Ambos métodos comienzan con un puñado de palabras semilla y datos de texto sin anotaciones.

Meta-Bootstrapping de Riloff y Jones en 1999. ^[28] Nivel uno: Generar patrones de extracción basados en las reglas predefinidas y los patrones extraídos por la cantidad de palabras semilla que contiene cada patrón. Nivel dos: Se marcarán las 5 palabras principales y se agregarán al diccionario. Repetir.
Basilisk ( Enfoque de arranque para la inducción del léxico semántico utilizando el conocimiento semántico ) de Thelen y Riloff. ^[29] Paso uno: generar patrones de extracción. Paso dos: mover los mejores patrones del grupo de patrones al grupo de palabras candidatas. Paso tres: se marcarán las 10 palabras principales y se agregarán al diccionario. Repetir.

En general, estos algoritmos resaltan la necesidad de reconocimiento y extracción automáticos de patrones en tareas subjetivas y objetivas.

Los clasificadores subjetivos y de objetos pueden mejorar las diversas aplicaciones del procesamiento del lenguaje natural. Uno de los principales beneficios del clasificador es que popularizó la práctica de los procesos de toma de decisiones basados en datos en diversas industrias. Según Liu, las aplicaciones de la identificación subjetiva y objetiva se han implementado en los negocios, la publicidad, los deportes y las ciencias sociales. ^[30]

Clasificación de reseñas en línea: en la industria empresarial, el clasificador ayuda a la empresa a comprender mejor los comentarios sobre el producto y los razonamientos detrás de las reseñas.
Información procesable: las emociones, el sarcasmo, el tono y otros matices que antes eran difíciles de analizar mediante el procesamiento del lenguaje natural tradicional (fuera de lo "positivo", "negativo" o "neutral"), se explican con mayor precisión a partir de los comentarios de los consumidores. Esto hace que los datos de las reseñas no estructuradas sean cada vez más útiles en términos de servicio al cliente, mejoras de productos y servicios, identificación de tendencias específicas de la industria y análisis competitivo. ^[31]
Predicción del precio de las acciones: en la industria financiera, el clasificador ayuda al modelo de predicción al procesar información auxiliar de las redes sociales y otra información textual de Internet. Estudios previos sobre el precio de las acciones japonesas realizados por Dong et al. indican que el modelo con módulo subjetivo y objetivo puede funcionar mejor que aquellos sin esta parte. ^[32]
Análisis de redes sociales.
Clasificación de la retroalimentación de los estudiantes. ^[33]
Resumen del documento: El clasificador puede extraer comentarios específicos del objetivo y recopilar opiniones realizadas por una entidad en particular.
Respuesta a preguntas complejas. El clasificador puede analizar las preguntas complejas clasificando el tema del lenguaje o el objetivo y el objetivo central. En la investigación de Yu et al. (2003), el investigador desarrolló un grupo de oración y de documento que identifica los artículos de opinión. ^[34]
Aplicaciones específicas del dominio.
Análisis de correo electrónico: el clasificador subjetivo y objetivo detecta el spam al rastrear patrones de idioma con palabras objetivo.

Basado en características/aspectos

Se refiere a determinar las opiniones o sentimientos expresados sobre diferentes características o aspectos de entidades, por ejemplo, de un teléfono celular, una cámara digital o un banco. ^[35] Una característica o aspecto es un atributo o componente de una entidad, por ejemplo, la pantalla de un teléfono celular, el servicio de un restaurante o la calidad de imagen de una cámara. La ventaja del análisis de sentimientos basado en características es la posibilidad de capturar matices sobre los objetos de interés. Diferentes características pueden generar diferentes respuestas de sentimiento, por ejemplo, un hotel puede tener una ubicación conveniente, pero comida mediocre. ^[36] Este problema involucra varios subproblemas, por ejemplo, identificar entidades relevantes, extraer sus características/aspectos y determinar si una opinión expresada sobre cada característica/aspecto es positiva, negativa o neutral. ^[37] La identificación automática de características se puede realizar con métodos sintácticos, con modelado de temas , ^[38]^[39] o con aprendizaje profundo . ^[40]^[41] Se pueden encontrar discusiones más detalladas sobre este nivel de análisis de sentimientos en el trabajo de Liu. ^[23]

Clasificación de intensidad

Las emociones y los sentimientos son de naturaleza subjetiva . El grado de emociones/sentimientos expresados en un texto determinado a nivel de documento, oración o característica/aspecto (el grado de intensidad expresado en la opinión sobre un documento, una oración o una entidad) difiere de un caso a otro. ^[42] Sin embargo, predecir solo la emoción y el sentimiento no siempre transmite información completa. El grado o nivel de emociones y sentimientos a menudo juega un papel crucial en la comprensión del sentimiento exacto dentro de una sola clase (por ejemplo, "bueno" versus "impresionante"). Algunos métodos aprovechan un método de conjunto apilado ^[43] para predecir la intensidad de la emoción y el sentimiento combinando los resultados obtenidos y utilizando modelos de aprendizaje profundo basados en redes neuronales convolucionales , ^[44] redes de memoria a corto plazo y unidades recurrentes bloqueadas . ^[45]

Métodos y características

Los enfoques existentes para el análisis de sentimientos se pueden agrupar en tres categorías principales: técnicas basadas en el conocimiento, métodos estadísticos y enfoques híbridos. ^[46] Las técnicas basadas en el conocimiento clasifican el texto por categorías de afecto basadas en la presencia de palabras de afecto inequívocas como feliz, triste, asustado y aburrido. ^[47] Algunas bases de conocimiento no solo enumeran palabras de afecto obvias, sino que también asignan a palabras arbitrarias una "afinidad" probable con emociones particulares. ^[48] Los métodos estadísticos aprovechan elementos del aprendizaje automático como el análisis semántico latente , las máquinas de vectores de soporte , la " bolsa de palabras ", la " información mutua puntual " para la orientación semántica, ^{[6] los modelos} de espacio semántico o modelos de incrustación de palabras , ^[49] y el aprendizaje profundo . Los métodos más sofisticados intentan detectar al titular de un sentimiento (es decir, la persona que mantiene ese estado afectivo) y el objetivo (es decir, la entidad sobre la que se siente el afecto). ^[50] Para extraer la opinión en contexto y obtener la característica sobre la que el hablante ha opinado, se utilizan las relaciones gramaticales de las palabras. Las relaciones de dependencia gramatical se obtienen mediante un análisis profundo del texto. ^[51] Los enfoques híbridos aprovechan tanto el aprendizaje automático como los elementos de la representación del conocimiento, como las ontologías y las redes semánticas, para detectar semánticas que se expresan de manera sutil, por ejemplo, a través del análisis de conceptos que no transmiten explícitamente información relevante, pero que están vinculados implícitamente a otros conceptos que sí lo hacen. ^[52]

Las herramientas de software de código abierto, así como una variedad de herramientas de análisis de sentimientos gratuitas y pagas, implementan técnicas de aprendizaje automático , estadísticas y procesamiento del lenguaje natural para automatizar el análisis de sentimientos en grandes colecciones de textos, incluidas páginas web, noticias en línea, grupos de discusión de Internet, reseñas en línea, blogs web y redes sociales. ^[53] Los sistemas basados en el conocimiento, por otro lado, hacen uso de recursos disponibles públicamente para extraer la información semántica y afectiva asociada con los conceptos del lenguaje natural. El sistema puede ayudar a realizar un razonamiento de sentido común afectivo . ^[54] El análisis de sentimientos también se puede realizar en contenido visual, es decir, imágenes y videos (ver Análisis de sentimientos multimodal ). Uno de los primeros enfoques en esta dirección es SentiBank ^[55] que utiliza una representación de pares adjetivo-sustantivo del contenido visual. Además, la gran mayoría de los enfoques de clasificación de sentimientos se basan en el modelo de bolsa de palabras, que ignora el contexto, la gramática e incluso el orden de las palabras . Los enfoques que analizan el sentimiento basándose en cómo las palabras componen el significado de frases más largas han mostrado mejores resultados, ^[56] pero implican una sobrecarga de anotación adicional.

En el análisis de sentimientos se requiere un componente de análisis humano, ya que los sistemas automatizados no pueden analizar las tendencias históricas de los comentaristas individuales o de la plataforma y, a menudo, se clasifican incorrectamente en sus sentimientos expresados. La automatización afecta aproximadamente al 23 % de los comentarios que son clasificados correctamente por humanos. ^[57] Sin embargo, los humanos a menudo no están de acuerdo, y se argumenta que el acuerdo entre humanos proporciona un límite superior que los clasificadores de sentimientos automatizados pueden alcanzar eventualmente. ^[58]

Evaluación

La precisión de un sistema de análisis de sentimientos es, en principio, lo bien que concuerda con los juicios humanos. Esto se mide generalmente mediante medidas de variantes basadas en la precisión y la recuperación de las dos categorías objetivo de textos negativos y positivos. Sin embargo, según la investigación, los evaluadores humanos normalmente solo concuerdan alrededor del 80% ^[59] del tiempo (consulte Fiabilidad entre evaluadores ). Por lo tanto, un programa que logra una precisión del 70% en la clasificación de sentimientos lo hace casi tan bien como los humanos, aunque tal precisión puede no parecer impresionante. Si un programa "tuviera razón" el 100% del tiempo, los humanos seguirían estando en desacuerdo con él alrededor del 20% del tiempo, ya que discrepan tanto sobre cualquier respuesta. ^{[ cita requerida ]}

Por otra parte, los sistemas informáticos cometen errores muy diferentes a los de los evaluadores humanos, por lo que las cifras no son totalmente comparables. Por ejemplo, un sistema informático tendrá problemas con las negaciones, las exageraciones, los chistes o el sarcasmo, que normalmente son fáciles de manejar para un lector humano: algunos errores que comete un sistema informático le parecerán demasiado ingenuos a un humano. En general, se ha puesto en tela de juicio la utilidad para las tareas comerciales prácticas del análisis de sentimientos tal como se define en la investigación académica, sobre todo porque el modelo unidimensional simple de sentimiento de negativo a positivo produce muy poca información procesable para un cliente preocupado por el efecto del discurso público sobre, por ejemplo, la marca o la reputación corporativa. ^[60]^[61]^[62]

Para adaptarse mejor a las necesidades del mercado, la evaluación del análisis de sentimientos se ha trasladado a medidas más basadas en tareas, formuladas en conjunto con representantes de agencias de relaciones públicas y profesionales de la investigación de mercado. El enfoque en, por ejemplo, el conjunto de datos de evaluación de RepLab se centra menos en el contenido del texto en cuestión y más en el efecto del texto en cuestión sobre la reputación de la marca . ^[63]^[64]^[65]

Debido a que la evaluación del análisis de sentimientos se basa cada vez más en tareas, cada implementación necesita un modelo de entrenamiento separado para obtener una representación más precisa del sentimiento para un conjunto de datos determinado.

Web 2.0

El auge de las redes sociales, como los blogs y las redes sociales, ha alimentado el interés por el análisis de sentimientos. Con la proliferación de reseñas, calificaciones, recomendaciones y otras formas de expresión en línea, la opinión en línea se ha convertido en una especie de moneda virtual para las empresas que buscan comercializar sus productos, identificar nuevas oportunidades y gestionar su reputación. A medida que las empresas buscan automatizar el proceso de filtrar el ruido, comprender las conversaciones, identificar el contenido relevante y actuar en consecuencia, muchas están recurriendo ahora al campo del análisis de sentimientos. ^[66] Para complicar aún más el asunto, está el auge de las plataformas de redes sociales anónimas como 4chan y Reddit . ^[67] Si la web 2.0 se centraba en democratizar la publicación, entonces la siguiente etapa de la web bien podría basarse en democratizar la minería de datos de todo el contenido que se publica. ^[68]

Un paso hacia este objetivo se está dando en el ámbito de la investigación. Varios equipos de investigación de universidades de todo el mundo se centran actualmente en comprender la dinámica de los sentimientos en las comunidades electrónicas mediante el análisis de sentimientos. ^[69]

El problema es que la mayoría de los algoritmos de análisis de sentimientos utilizan términos simples para expresar sentimientos sobre un producto o servicio. Sin embargo, los factores culturales, los matices lingüísticos y los diferentes contextos hacen que sea extremadamente difícil convertir una cadena de texto escrito en un simple sentimiento a favor o en contra. ^[66] El hecho de que los humanos a menudo no estén de acuerdo sobre el sentimiento del texto ilustra la enorme tarea que supone para las computadoras hacerlo bien. Cuanto más corta sea la cadena de texto, más difícil se vuelve.

Aunque las cadenas de texto cortas pueden ser un problema, el análisis de sentimientos en el microblogging ha demostrado que Twitter puede ser visto como un indicador válido en línea del sentimiento político. El sentimiento político de los tweets demuestra una estrecha correspondencia con las posiciones políticas de los partidos y los políticos, lo que indica que el contenido de los mensajes de Twitter refleja de manera plausible el panorama político fuera de línea. ^[70] Además, se ha demostrado que el análisis de sentimientos en Twitter también captura el estado de ánimo público detrás de los ciclos de reproducción humana a nivel mundial, ^[71] así como otros problemas de relevancia para la salud pública, como las reacciones adversas a los medicamentos. ^[72]

Si bien el análisis de sentimientos ha sido popular en los ámbitos en los que los autores expresan su opinión de forma bastante explícita ("la película es increíble"), como las redes sociales y las reseñas de productos, recién hace poco se idearon métodos sólidos para otros ámbitos en los que el sentimiento es fuertemente implícito o indirecto. Por ejemplo, en los artículos de noticias (debido principalmente a la objetividad periodística esperada), los periodistas a menudo describen acciones o eventos en lugar de indicar directamente la polaridad de una pieza de información. Los enfoques anteriores que utilizaban diccionarios o funciones de aprendizaje automático superficial no podían captar el "significado entre líneas", pero recientemente los investigadores han propuesto un enfoque y un conjunto de datos basados en el aprendizaje profundo que pueden analizar el sentimiento en los artículos de noticias. ^[1]

Los investigadores han utilizado el análisis de sentimientos para analizar los tweets sobre seguridad y salud en la construcción (que ahora se denominan X). La investigación reveló que existe una correlación positiva entre los favoritos y los retuits en términos de valencia de sentimiento. Otros han examinado el impacto de YouTube en la difusión de conocimientos sobre seguridad y salud en la construcción. Investigaron cómo las emociones influyen en los comportamientos de los usuarios en términos de visualización y comentarios a través del análisis semántico. En otro estudio, el sentimiento positivo representó una cifra abrumadora del 85% en el intercambio de conocimientos sobre seguridad y salud en la construcción a través de Instagram. ^[73]

Aplicación en sistemas de recomendación

Se ha demostrado que el análisis de sentimientos es una técnica valiosa para un sistema de recomendación . Un sistema de recomendación tiene como objetivo predecir la preferencia por un elemento de un usuario objetivo. Los sistemas de recomendación convencionales funcionan con un conjunto de datos explícitos. Por ejemplo, el filtrado colaborativo funciona con la matriz de calificación y el filtrado basado en contenido funciona con los metadatos de los elementos.

En muchos servicios de redes sociales o sitios web de comercio electrónico , los usuarios pueden proporcionar reseñas de texto, comentarios o retroalimentación sobre los artículos. Estos textos generados por el usuario proporcionan una rica fuente de opiniones de los usuarios sobre numerosos productos y artículos. Potencialmente, para un artículo, dicho texto puede revelar tanto las características/aspectos relacionados del artículo como los sentimientos de los usuarios sobre cada característica. ^[74] Las características/aspectos del artículo descritos en el texto juegan el mismo papel que los metadatos en el filtrado basado en contenido , pero los primeros son más valiosos para el sistema de recomendación. Dado que los usuarios mencionan ampliamente estas características en sus reseñas, pueden verse como las características más cruciales que pueden influir significativamente en la experiencia del usuario sobre el artículo, mientras que los metadatos del artículo (generalmente proporcionados por los productores en lugar de los consumidores) pueden ignorar las características que preocupan a los usuarios. Para diferentes artículos con características comunes, un usuario puede dar diferentes sentimientos. Además, una característica del mismo artículo puede recibir diferentes sentimientos de diferentes usuarios. Los sentimientos de los usuarios sobre las características pueden considerarse como una puntuación de calificación multidimensional, que refleja sus preferencias sobre los elementos.

En función de las características/aspectos y los sentimientos extraídos del texto generado por el usuario, se puede construir un sistema de recomendación híbrido. ^[75] Hay dos tipos de motivación para recomendar un elemento candidato a un usuario. La primera motivación es que el elemento candidato tiene numerosas características comunes con los elementos preferidos del usuario, ^[76] mientras que la segunda motivación es que el elemento candidato recibe un alto sentimiento sobre sus características. Para un elemento preferido, es razonable creer que los elementos con las mismas características tendrán una función o utilidad similar. Por lo tanto, es probable que estos elementos también sean preferidos por el usuario. Por otro lado, para una característica compartida de dos elementos candidatos, otros usuarios pueden dar un sentimiento positivo a uno de ellos mientras que dan un sentimiento negativo a otro. Claramente, el elemento mejor evaluado debería ser recomendado al usuario. En función de estas dos motivaciones, se puede construir una puntuación de clasificación combinada de similitud y calificación de sentimiento para cada elemento candidato. ^[75]

Aparte de la dificultad del análisis de sentimientos en sí, la aplicación del análisis de sentimientos en las reseñas o comentarios también se enfrenta al desafío del spam y las reseñas sesgadas. Una dirección de trabajo se centra en evaluar la utilidad de cada reseña. ^[77] Una reseña o un comentario mal escrito no es de mucha ayuda para el sistema de recomendación. Además, una reseña puede estar diseñada para obstaculizar las ventas de un producto objetivo, lo que puede ser perjudicial para el sistema de recomendación incluso si está bien escrita.

Los investigadores también descubrieron que las formas largas y cortas de texto generado por el usuario deberían tratarse de manera diferente. Un resultado interesante muestra que las reseñas en formato corto a veces son más útiles que las de formato largo, ^[78] porque es más fácil filtrar el ruido en un texto de formato corto. En el caso del texto de formato largo, la creciente longitud del texto no siempre trae consigo un aumento proporcional en la cantidad de características o sentimientos en el texto.

Lamba y Madhusudhan ^[79] presentan una forma innovadora de satisfacer las necesidades de información de los usuarios de bibliotecas actuales, reorganizando los resultados del análisis de sentimientos de plataformas de redes sociales como Twitter y brindándolos como un servicio consolidado basado en el tiempo en diferentes formatos. Además, proponen una nueva forma de realizar marketing en bibliotecas utilizando la minería de datos de redes sociales y el análisis de sentimientos.

Véase también

Referencias

^ ab Hamborg, Felix; Donnay, Karsten (2021). "NewsMTSC: un conjunto de datos para la clasificación de sentimientos dependiente de (múltiples) objetivos en artículos de noticias políticas". "Actas de la 16.ª Conferencia del Capítulo Europeo de la Asociación de Lingüística Computacional: Volumen principal"
^ Vong Anh Ho, Duong Huynh-Cong Nguyen, Danh Hoang Nguyen, Linh Thi-Van Pham, Duc-Vu Nguyen, Kiet Van Nguyen, Ngan Luu-Thuy Nguyen. "Reconocimiento de emociones para texto de redes sociales vietnamitas". En Actas de la Conferencia Internacional de 2019 de la Asociación del Pacífico de Lingüística Computacional (PACLING 2019), Hanoi, Vietnam (2019).
^ Stone, Philip J., Dexter C. Dunphy y Marshall S. Smith. "El investigador general: un enfoque informático para el análisis de contenido". MIT Press, Cambridge, MA (1966).
^ Gottschalk, Louis August y Goldine C. Gleser . La medición de los estados psicológicos a través del análisis de contenido de la conducta verbal. Univ of California Press, 1969.
^ EE.UU., número 7.136.877, Volcani, Yanon; y Fogel, David B., "Sistema y método para determinar y controlar el impacto del texto", publicado el 28 de junio de 2001
^ ab Turney, Peter (2002). "¿Pulgar hacia arriba o pulgar hacia abajo? Orientación semántica aplicada a la clasificación no supervisada de reseñas". Actas de la Asociación de Lingüística Computacional . págs. 417–424. arXiv : cs.LG/0212032 .
^ Pang, Bo; Lee, Lillian ; Vaithyanathan, Shivakumar (2002). "¿Pulgar hacia arriba? Clasificación de sentimientos mediante técnicas de aprendizaje automático". Actas de la Conferencia sobre métodos empíricos en el procesamiento del lenguaje natural (EMNLP) . págs. 79–86.
^ ab Pang, Bo; Lee, Lillian (2005). "Ver estrellas: Explotación de relaciones de clase para la categorización de sentimientos con respecto a escalas de calificación". Actas de la Asociación de Lingüística Computacional (ACL) . págs. 115–124.
^ ab Snyder, Benjamin; Barzilay, Regina (2007). "Multiple Aspect Ranking using the Good Grief Algorithm". Actas de la Conferencia conjunta de Tecnología del lenguaje humano/Capítulo norteamericano de la ACL (HLT-NAACL) . pp. 300–307. Archivado desde el original el 6 de agosto de 2016. Consultado el 16 de junio de 2009 .
^ Qu, Yan, James Shanahan y Janyce Wiebe . "Explorando la actitud y el afecto en el texto: teorías y aplicaciones". En el Simposio de primavera de la AAAI, Informe técnico SS-04-07. AAAI Press, Menlo Park, CA. 2004.
^ Vryniotis, Vasilis (2013). La importancia de la clase neutral en el análisis de sentimientos.
^ Koppel, Moshé; Schler, Jonathan (2006). "La importancia de ejemplos neutrales para aprender el sentimiento". Inteligencia Computacional 22 . págs. 100-109. CiteSeerX 10.1.1.84.9735 .
^ Ribeiro, Filipe Nunes; Araujo, Matheus (2010). "Una comparación de referencia de los métodos de análisis de sentimientos más modernos". Transactions on Embedded Computing Systems . 9 (4).
^ Taboada, Maite; Brooke, Julian (2011). "Métodos basados en léxico para el análisis de sentimientos". Computational Linguistics . 37 (2): 272–274. CiteSeerX 10.1.1.188.5517 . doi :10.1162/coli_a_00049. S2CID 3181362.
^ Augustyniak, Łukasz; Szymanski, Piotr; Kajdanowicz, Tomasz; Tuligłowicz, Włodzimierz (25 de diciembre de 2015). "Estudio integral sobre el análisis de sentimientos de clasificación por conjuntos basado en léxico". Entropía . 18 (1): 4. Bibcode : 2015Entrp..18....4A. doi : 10.3390/e18010004 .
^ Thelwall, Mike; Buckley, Kevan; Paltoglou, Georgios; Cai, Di; Kappas, Arvid (2010). "Detección de la fuerza del sentimiento en textos informales breves". Revista de la Sociedad Estadounidense de Ciencias de la Información y Tecnología . 61 (12): 2544–2558. CiteSeerX 10.1.1.278.3863 . doi :10.1002/asi.21416.
^ Pang, Bo; Lee, Lillian (2008). "4.1.2 Detección de subjetividad e identificación de opiniones". Minería de opiniones y análisis de sentimientos . Now Publishers Inc.
^ Mihalcea, Rada; Banea, Carmen; Wiebe, Janyce (2007). "Aprendizaje del lenguaje subjetivo multilingüe mediante proyecciones interlingüísticas" (PDF) . Actas de la Asociación de Lingüística Computacional (ACL) . págs. 976–983. Archivado desde el original (PDF) el 8 de julio de 2010.
^ Su, Fangzhong; Markert, Katja (2008). "De las palabras a los sentidos: un estudio de caso sobre el reconocimiento de la subjetividad" (PDF) . Actas de Coling 2008, Manchester, Reino Unido .
^ Pang, Bo; Lee, Lillian (2004). "Una educación sentimental: análisis de sentimientos mediante el resumen de la subjetividad basado en cortes mínimos". Actas de la Asociación de Lingüística Computacional (ACL) . pp. 271–278.
^ ab Wiebe, Janyce ; Riloff, Ellen (2005). "Creación de clasificadores de oraciones subjetivas y objetivas a partir de textos no anotados". En Gelbukh, Alexander (ed.). Lingüística computacional y procesamiento inteligente de textos . Apuntes de clase en informática. Vol. 3406. Berlín, Heidelberg: Springer. págs. 486–497. doi :10.1007/978-3-540-30586-6_53. ISBN 978-3-540-30586-6.
^ Quirk, Randolph; Greenbaum, Sidney; Geoffrey, Leech; Jan, Svartvik (1985). Gramática completa de la lengua inglesa (Gramática general) . Longman . Págs. 175-239. ISBN. 1933108312.
^ abc Liu, Bing (2010). "Análisis de sentimientos y subjetividad" (PDF) . En Indurkhya, N.; Damerau, FJ (eds.). Manual de procesamiento del lenguaje natural (segunda edición).
^ ab Pang, Bo; Lee, Lillian (6 de julio de 2008). "Opinion Mining and Sentiment Analysis". Fundamentos y tendencias en la recuperación de información . 2 (1–2): 1–135. doi :10.1561/1500000011. ISSN 1554-0669. S2CID 207178694.
^ Riloff, Ellen; Wiebe, Janyce (11 de julio de 2003). "Aprendizaje de patrones de extracción para expresiones subjetivas". Actas de la conferencia de 2003 sobre métodos empíricos en el procesamiento del lenguaje natural - . EMNLP '03. Vol. 10. EE. UU.: Asociación de Lingüística Computacional. págs. 105–112. doi : 10.3115/1119355.1119369 . S2CID 6541910.
^ Wiebe, Janyce ; Riloff, Ellen (julio de 2011). "Encontrar beneficios mutuos entre el análisis de la subjetividad y la extracción de información". IEEE Transactions on Affective Computing . 2 (4): 175–191. doi :10.1109/T-AFFC.2011.19. ISSN 1949-3045. S2CID 16820846.
^ Riloff, Ellen (1 de agosto de 1996). "Un estudio empírico de la construcción automatizada de diccionarios para la extracción de información en tres dominios". Inteligencia artificial . 85 (1): 101–134. doi : 10.1016/0004-3702(95)00123-9 . ISSN 0004-3702.
^ Riloff, Ellen; Jones, Rosie (julio de 1999). "Diccionarios de aprendizaje para la extracción de información mediante el arranque en múltiples niveles" (PDF) . AAAI '99/IAAI '99: Actas de la Decimosexta Conferencia Nacional sobre Inteligencia Artificial y la Undécima Conferencia sobre Aplicaciones Innovadoras de la Inteligencia Artificial Aplicaciones Innovadoras de la Inteligencia Artificial : 474–479.
^ Thelen, Michael; Riloff, Ellen (6 de julio de 2002). "Un método de arranque para el aprendizaje de léxicos semánticos utilizando contextos de patrones de extracción". Actas de la conferencia ACL-02 sobre métodos empíricos en el procesamiento del lenguaje natural - EMNLP '02 . Vol. 10. EE. UU.: Asociación de Lingüística Computacional. págs. 214–221. doi : 10.3115/1118693.1118721 . S2CID 137155.
^ Liu, Bing (23 de mayo de 2012). «Análisis de sentimientos y minería de opiniones». Synthesis Lectures on Human Language Technologies . 5 (1): 1–167. doi :10.2200/S00416ED1V01Y201204HLT016. ISSN 1947-4040. S2CID 38022159. Archivado desde el original el 10 de mayo de 2021 . Consultado el 9 de diciembre de 2020 .
^ Gagnon, Kyle (17 de mayo de 2024). "Cómo la IA está transformando las reseñas en línea en inteligencia empresarial práctica". Widewail . Consultado el 19 de septiembre de 2024 .
^ Deng, Shangkun; Mitsubuchi, Takashi; Shioda, Kei; Shimada, Tatsuro; Sakurai, Akito (diciembre de 2011). "Combinación de análisis técnico con análisis de sentimientos para la predicción del precio de las acciones". Novena conferencia internacional IEEE de 2011 sobre computación confiable, autónoma y segura . IEEE. págs. 800–807. doi :10.1109/dasc.2011.138. ISBN . 978-1-4673-0006-3.S2CID15262023 .
^ Nguyen, Kiet Van; Nguyen, Vu Duc; Nguyen, Phu XV; Truong, Tham TH; Nguyen, Ngan LT. (1 de octubre de 2018). "UIT-VSFC: corpus de comentarios de estudiantes vietnamitas para el análisis de sentimientos". 2018 10° Congreso Internacional sobre Conocimiento e Ingeniería de Sistemas (KSE) . Vietnam: IEEE. págs. 19-24. doi :10.1109/KSE.2018.8573337. ISBN 978-1-5386-6113-0.S2CID56172224 .
^ Yu, Hong; Hatzivassiloglou, Vasileios (11 de julio de 2003). "Hacia la respuesta a preguntas de opinión". Actas de la conferencia de 2003 sobre métodos empíricos en el procesamiento del lenguaje natural - . EMNLP '03. Vol. 10. EE. UU.: Asociación de Lingüística Computacional. págs. 129–136. doi : 10.3115/1119355.1119372 .
^ Hu, Minqing; Liu, Bing (2004). "Extracción y resumen de opiniones de clientes". Actas de KDD 2004 .
^ Cataldi, Mario; Ballatore, Andrea; Tiddi, Ilaria; Aufaure, Marie-Aude (22 de junio de 2013). "Buena ubicación, comida terrible: detección de sentimientos sobre características en reseñas generadas por los usuarios". Análisis y minería de redes sociales . 3 (4): 1149–1163. CiteSeerX 10.1.1.396.9313 . doi :10.1007/s13278-013-0119-7. ISSN 1869-5450. S2CID 5025282.
^ Liu, Bing; Hu, Minqing; Cheng, Junsheng (2005). "Opinion Observer: análisis y comparación de opiniones en la Web". Actas de WWW 2005 .
^ Zhai, Zhongwu; Liu, Bing; Xu, Hua; Jia, Peifa (1 de enero de 2011). "LDA restringida para agrupar características de productos en minería de opiniones". En Huang, Joshua Zhexue; Cao, Longbing; Srivastava, Jaideep (eds.). Avances en el descubrimiento de conocimientos y minería de datos . Notas de clase en informática. Vol. 6634. Springer Berlin Heidelberg. págs. 448–459. CiteSeerX 10.1.1.221.5178 . doi :10.1007/978-3-642-20841-6_37. ISBN . 978-3-642-20840-9.
^ Titov, Ivan; McDonald, Ryan (1 de enero de 2008). "Modelado de reseñas en línea con modelos temáticos multigrano". Actas de la 17.ª conferencia internacional sobre la World Wide Web . WWW '08. Nueva York, NY, EE. UU.: ACM. pp. 111–120. arXiv : 0801.1063 . doi :10.1145/1367497.1367513. ISBN . 978-1-60558-085-2.S2CID13609860 .
^ Liang, Bin; et al. (2022). "Análisis de sentimientos basado en aspectos a través de redes convolucionales de grafos mejoradas con conocimiento afectivo". Knowledge-Based Systems . 235 : 107643. doi :10.1016/j.knosys.2021.107643. S2CID 237258427.
^ Ma, Yukun; et al. (2018). "Análisis de sentimientos basado en aspectos específicos mediante la incorporación de conocimiento de sentido común en un LSTM atento". Actas de la AAAI . págs. 5876–5883.
^ Sharma, Raksha; Somani; Kumar; Bhattacharyya (2017). "Clasificación de la intensidad de sentimiento entre adjetivos mediante incrustaciones de palabras que contienen sentimiento" (PDF) . Asociación de Lingüística Computacional : 547–552.
^ MS Akhtar, A. Ekbal y E. Cambria, "¿Qué tan intenso eres? Predicción de intensidades de emociones y sentimientos usando conjuntos apilados [Notas de aplicación]", en IEEE Computational Intelligence Magazine , vol. 15, n.º 1, págs. 64-75, febrero de 2020, doi: 10.1109/MCI.2019.2954667.
^ X. Ouyang, P. Zhou, CH Li y L. Liu, "Análisis de sentimientos mediante redes neuronales convolucionales", Conferencia internacional IEEE de 2015 sobre informática y tecnología de la información; Computación ubicua y comunicaciones; Computación confiable, autónoma y segura; Inteligencia y computación generalizadas, 2015, págs. 2359-2364, doi: 10.1109/CIT/IUCC/DASC/PICOM.2015.349.
^ Y. Santur, "Análisis de sentimientos basado en una unidad recurrente controlada", Simposio internacional sobre inteligencia artificial y procesamiento de datos (IDAP) de 2019, 2019, págs. 1-5, doi: 10.1109/IDAP.2019.8875985.
^ Cambria, E; Schuller, B; Xia, Y; Havasi, C (2013). "Nuevas vías en la minería de opiniones y el análisis de sentimientos". IEEE Intelligent Systems . 28 (2): 15–21. CiteSeerX 10.1.1.688.1384 . doi :10.1109/MIS.2013.30. S2CID 12104996.
^ Ortony, Andrew; Clore, G; Collins, A (1988). La estructura cognitiva de las emociones (PDF) . Cambridge Univ. Press. Archivado desde el original (PDF) el 23 de noviembre de 2015.
^ Stevenson, Ryan; Mikels, Joseph; James, Thomas (2007). "Caracterización de las normas afectivas para palabras en inglés mediante categorías emocionales discretas". Métodos de investigación del comportamiento . 39 (4): 1020–1024. doi : 10.3758/bf03192999 . PMID 18183921. S2CID 6673690.
^ Sahlgren, Magnus ; Karlgren, Jussi; Eriksson, Gunnar (2007). "Anotación de valencia basada en semillas en el espacio de palabras". Actas del Cuarto Taller Internacional sobre Evaluaciones Semánticas (SemEval-2007) .
^ Kim, SM; Hovy, EH (2006). "Identificación y análisis de opiniones de juicio". (PDF) . Actas de la conferencia de Tecnología del Lenguaje Humano/Asociación Norteamericana de Lingüística Computacional (HLT-NAACL 2006). Nueva York, NY . Archivado desde el original (PDF) el 29 de junio de 2011.
^ Dey, Lipika; Haque, SK Mirajul (2008). "Extracción de opiniones a partir de datos de texto ruidosos". Actas del segundo taller sobre análisis de datos de texto no estructurados ruidosos, págs. 83-90 .
^ Cambria, E; Hussain, A (2015). Computación sensorial: un marco basado en el sentido común para el análisis de sentimientos a nivel de concepto. Springer. ISBN 9783319236544.
^ Akcora, Cuneyt Gurcan; Bayir, Murat Ali; Demirbas, Murat; Ferhatosmanoglu, Hakan (2010). "Identificación de puntos de ruptura en la opinión pública". SigKDD, Actas del primer taller sobre análisis de redes sociales .
^ Cambria, Erik; Liu, Qian; Decherchi, Sergio; Xing, Frank; Kwok, Kenneth (2022). "SenticNet 7: Un marco de IA neurosimbólico basado en el sentido común para el análisis explicable de sentimientos" (PDF) . Actas de LREC . págs. 3829–3839.
^ Borth, Damian; Ji, Rongrong; Chen, Tao; Breuel, Thomas; Chang, Shih-Fu (2013). "Ontología y detectores de sentimientos visuales a gran escala que utilizan pares adjetivo-sustantivo". Actas de la Conferencia Internacional sobre Multimedia de la ACM . págs. 223–232. Archivado desde el original el 15 de abril de 2021. Consultado el 2 de noviembre de 2017 .
^ Socher, Richard; Perelygin, Alex; Wu, Jean Y.; Chuang, Jason; Manning, Christopher D.; Ng, Andrew Y.; Potts, Christopher (2013). "Modelos profundos recursivos para la composicionalidad semántica sobre un árbol de sentimientos". En Actas de EMNLP : 1631–1642. CiteSeerX 10.1.1.593.7427 .
^ "Estudio de caso: Análisis avanzado de sentimientos". Archivado desde el original el 29 de octubre de 2013 . Consultado el 18 de octubre de 2013 .
^ Mozetič, Igor; Grčar, Miha; Smailović, Jasmina (5 de mayo de 2016). "Clasificación multilingüe de sentimientos de Twitter: el papel de los anotadores humanos". MÁS UNO . 11 (5): e0155036. arXiv : 1602.07563 . Código Bib : 2016PLoSO..1155036M. doi : 10.1371/journal.pone.0155036 . ISSN 1932-6203. PMC 4858191 . PMID 27149621.
^ Ogneva, M. "Cómo las empresas pueden utilizar el análisis de sentimientos para mejorar sus negocios". Mashable . Consultado el 13 de diciembre de 2012 .
^ Karlgren, Jussi , Magnus Sahlgren , Fredrik Olsson, Fredrik Espinoza y Ola Hamfors. "Utilidad del análisis de sentimientos". En Conferencia europea sobre recuperación de información, págs. 426-435. Springer Berlín Heidelberg, 2012.
^ Karlgren, Jussi . "La relación entre el estado de ánimo del autor y el afecto con el sentimiento en el texto y el género textual". En Actas del cuarto taller sobre Explotación de anotaciones semánticas en la recuperación de información, págs. 9-10. ACM, 2011.
^ Karlgren, Jussi . "Afecto, atractivo y sentimiento como factores que influyen en la interacción con información multimedia". En Actas del taller Theseus/ImageCLEF sobre evaluación de la recuperación de información visual, págs. 8-11. 2009.
↑ Amigó, Enrique, Adolfo Corujo, Julio Gonzalo, Edgar Meij y Maarten de Rijke . "Descripción general de RepLab 2012: Evaluación de sistemas de gestión de reputación en línea". En CLEF (Notas de trabajo/laboratorios/taller en línea). 2012.
^ Amigó, Enrique, Jorge Carrillo De Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Tamara Martín, Edgar Meij, Maarten de Rijke y Damiano Spina. "Descripción general de replab 2013: evaluación de los sistemas de seguimiento de la reputación online". En Conferencia Internacional del Foro de Evaluación Interlingüística de Lenguas Europeas, págs. 333-352. Springer Berlín Heidelberg, 2013.
^ Amigó, Enrique, Jorge Carrillo-de-Albornoz, Irina Chugur, Adolfo Corujo, Julio Gonzalo, Edgar Meij, Maarten de Rijke y Damiano Spina. "Resumen de replab 2014: elaboración de perfiles de autores y dimensiones de reputación para la gestión de la reputación en línea". En la Conferencia Internacional del Foro de Evaluación Interlingüística para las Lenguas Europeas, págs. 307-322. Springer International Publishing, 2014.
^ ab Wright, Alex. "Explorando la Web en busca de sentimientos, no de hechos", New York Times , 23 de agosto de 2009. Recuperado el 1 de octubre de 2009.
^ "Análisis de sentimientos en Reddit". 30 de septiembre de 2014. Consultado el 10 de octubre de 2014 .
^ Kirkpatrick, Marshall. ", ReadWriteWeb , 15 de abril de 2009. Recuperado el 1 de octubre de 2009.
^ Condliffe, Jamie. "Flaming impulsa las redes sociales en línea", New Scientist , 7 de diciembre de 2010. Recuperado el 13 de diciembre de 2010.
^ Tumasjan, Andranik; O. Sprenger, Timm; G. Sandner, Philipp; M. Welpe, Isabell (2010). "Predicción de elecciones con Twitter: lo que 140 caracteres revelan sobre el sentimiento político" Archivado el 12 de diciembre de 2020 en Wayback Machine . "Actas de la Cuarta Conferencia Internacional AAAI sobre Weblogs y Medios Sociales"
^ Madera, Ian B.; Varela, Pedro L.; Bollen, Johan; Rocha, Luis M.; Gonçalves-Sá, Joana (2017). "Los ciclos sexuales humanos están impulsados por la cultura y coinciden con los estados de ánimo colectivos". Informes científicos . 7 (1): 17973. arXiv : 1707.03959 . Código Bib : 2017NatSR...717973W. doi :10.1038/s41598-017-18262-5. PMC 5740080 . PMID 29269945.
^ Korkontzelos, Ioannis; Nikfarjam, Azadeh; Shardlow, Matthew; Sarker, Abeed; Ananiadou, Sophia; Gonzalez, Graciela H. (2016). "Análisis del efecto del análisis de sentimientos en la extracción de reacciones adversas a medicamentos de tuits y publicaciones en foros". Journal of Biomedical Informatics . 62 : 148–158. doi :10.1016/j.jbi.2016.06.007. PMC 4981644 . PMID 27363901.
^ Zeng, L.; Li, RYM; Yigitcanlar, T.; Zeng, H. Minería de la opinión pública sobre la salud y la seguridad en la construcción: enfoque de asignación de Dirichlet latente. Buildings 2023, 13, 927. https://doi.org/10.3390/buildings13040927
^ Tang, Huifeng; Tan, Songbo; Cheng, Xueqi (2009). "Una encuesta sobre la detección de sentimientos en las reseñas" (PDF) . Expert Systems with Applications . 36 (7): 10760–10773. doi :10.1016/j.eswa.2009.02.063. S2CID 2178380. Archivado desde el original (PDF) el 24 de mayo de 2018.
^ ab Jakob, Niklas, et al. "Más allá de las estrellas: explotación de reseñas de usuarios en texto libre para mejorar la precisión de las recomendaciones de películas". Actas del primer taller internacional CIKM sobre análisis de sentimientos de temas para la opinión de las masas . ACM, 2009.
^ Minqing, Hu; Liu, Bing (2004). "Extracción de características de opinión en reseñas de clientes" (PDF) . AAAI . 4 (4). S2CID 5724860. Archivado desde el original (PDF) el 24 de mayo de 2018.
^ Liu, Yang; Huang, Xiangji; An, Aijun; Yu, Xiaohui (2008). "Modelado y predicción de la utilidad de las reseñas en línea" (PDF) . ICDM'08. Octava conferencia internacional IEEE sobre minería de datos . IEEE. págs. 443–452. doi :10.1109/ICDM.2008.94. ISBN. 978-0-7695-3502-9. Número de identificación del sujeto 18235238.
^ Bermingham, Adam; Smeaton, Alan F. (2010). "Clasificación de sentimientos en microblogs". Actas de la 19.ª conferencia internacional de la ACM sobre gestión de la información y el conocimiento (PDF) . pp. 1833–1836. doi :10.1145/1871437.1871741. ISBN . 9781450300995.S2CID2084603 .
^ Lamba, Manika; Madhusudhan, Margam (2018). "Aplicación del análisis de sentimientos en bibliotecas para proporcionar un servicio de información temporal: un estudio de caso sobre diversas facetas de la productividad". Análisis y minería de redes sociales . 8 (1): 1–12. doi :10.1007/s13278-018-0541-y. S2CID 53047128.