Una interfaz de usuario conversacional (CUI) es una interfaz de usuario para computadoras que emula una conversación con un humano real. [1] Históricamente, las computadoras han dependido de interfaces de usuario basadas en texto e interfaces gráficas de usuario (GUI) (como el usuario presionando un botón "atrás") para traducir la acción deseada del usuario en comandos que la computadora entiende. Si bien es un mecanismo eficaz para completar acciones informáticas, existe una curva de aprendizaje para el usuario asociada con la GUI. [2] En cambio, las CUI brindan la oportunidad para que el usuario se comunique con la computadora en su lenguaje natural en lugar de en comandos específicos de sintaxis. [3]
Para ello, las interfaces conversacionales utilizan el procesamiento del lenguaje natural (PLN) para permitir que las computadoras comprendan, analicen y creen significado a partir del lenguaje humano. [4] A diferencia de los procesadores de texto, el PLN considera la estructura del lenguaje humano (es decir, las palabras forman frases; las frases forman oraciones que transmiten la idea o intención que el usuario está tratando de invocar). La naturaleza ambigua del lenguaje humano hace que sea difícil para una máquina interpretar siempre correctamente las solicitudes del usuario, por lo que hemos visto un cambio hacia la comprensión del lenguaje natural (PLN). [5]
La NLU permite el análisis de sentimientos y las búsquedas conversacionales, lo que permite que una línea de preguntas continúe, con el contexto presente durante toda la conversación. La NLU permite que las interfaces conversacionales gestionen entradas no estructuradas que el cerebro humano puede comprender, como errores ortográficos en preguntas de seguimiento. [6] Por ejemplo, al aprovechar la NLU, un usuario podría preguntar primero por la población de los Estados Unidos. Si luego el usuario pregunta "¿Quién es el presidente?", la búsqueda trasladará el contexto de los Estados Unidos y proporcionará la respuesta adecuada.
Las interfaces conversacionales han surgido como una herramienta para que las empresas proporcionen a los consumidores información relevante de manera eficiente y rentable. [7] Las CUI brindan facilidad de acceso a información relevante y contextual al usuario final sin las complejidades y la curva de aprendizaje típicamente asociadas con la tecnología.
Si bien existe una variedad de marcas de interfaces, hasta la fecha, hay dos categorías principales de interfaces conversacionales: asistentes de voz y chatbots . [8]
Una interfaz de usuario de voz permite al usuario completar una acción pronunciando un comando. Siri de Apple, que se presentó en octubre de 2011, fue uno de los primeros asistentes de voz ampliamente adoptados. Siri permitía a los usuarios de iPhone obtener información y completar acciones en su dispositivo simplemente preguntándoselo. En los últimos años, Siri se integró con los dispositivos HomePod de Apple .
Desde la introducción de Siri, se han seguido desarrollando dispositivos domésticos como Google Home o Amazon Echo (con tecnología de Alexa) que permiten a los usuarios "conectar" sus hogares a través de una serie de dispositivos inteligentes para ampliar las opciones de acciones tangibles que pueden realizar. Los usuarios ahora pueden apagar las luces, establecer recordatorios y llamar a sus amigos, todo ello mediante una cola verbal.
Estas interfaces conversacionales que utilizan un asistente de voz se han convertido en una forma popular para que las empresas interactúen con sus clientes, ya que la interfaz elimina cierta fricción en el recorrido del cliente . Los clientes ya no necesitan recordar una larga lista de nombres de usuario y contraseñas para sus distintas cuentas; simplemente vinculan cada cuenta a Google o Amazon una vez, y se acabaron los días en los que necesitaban esperar en espera durante una hora para hacer una pregunta simple.
Un chatbot es una interfaz web o móvil que permite al usuario hacer preguntas y recuperar información . Esta información puede ser de naturaleza genérica, como la ventana de chat de Google Assistant que permite realizar búsquedas en Internet, o puede ser una marca o servicio específico que permite al usuario obtener información sobre el estado de sus diversas cuentas. Sus sistemas backend funcionan de la misma manera que un asistente de voz, con el frontend utilizando una interfaz visual para transmitir información. Esta interfaz visual puede ser beneficiosa para las empresas que necesitan realizar transacciones comerciales más complejas con los clientes, ya que se pueden utilizar instrucciones, enlaces profundos y gráficos para transmitir una respuesta. La complejidad a la que un chatbot responde a las preguntas depende del desarrollo del backend. Los chatbots con respuestas codificadas tienen una base más pequeña de información y habilidades correspondientes. Los chatbots que aprovechan el aprendizaje automático seguirán creciendo y desarrollando bases de contenido más grandes para respuestas más complejas [ cita requerida ] . [9]
Cada vez con más frecuencia, las empresas están aprovechando los chatbots como una forma de descargar preguntas y transacciones simples de los agentes humanos. [10] Estos chatbots brindan la opción de ayudar a un usuario, pero luego transfieren directamente al cliente a un agente en vivo dentro de la misma ventana de chat si la conversación se vuelve demasiado compleja, esta característica se llama Human Handover, plataformas de chatbot como BotPenguin y otras plataformas ofrecen tales características en sus chatbots. [11] Los chatbots han evolucionado y han recorrido un largo camino desde sus inicios. Los chatbots modernos tienen personalidades que los hacen sonar más humanos.