Asistente virtual

Un asistente virtual ( VA ) es un agente de software que puede realizar una variedad de tareas o servicios para un usuario en función de la información que este le proporcione, como comandos o preguntas, incluidas las verbales. Estas tecnologías suelen incorporar capacidades de chatbot para simular una conversación humana, como por ejemplo a través de un chat en línea , para facilitar la interacción con sus usuarios. La interacción puede ser a través de texto, interfaz gráfica o voz, ya que algunos asistentes virtuales pueden interpretar el habla humana y responder a través de voces sintetizadas.

En muchos casos, los usuarios pueden hacer preguntas a sus asistentes virtuales, controlar dispositivos de automatización del hogar y reproducción de medios, y administrar otras tareas básicas como el correo electrónico, listas de tareas pendientes y calendarios, todo con comandos verbales. ^[1] En los últimos años, los asistentes virtuales destacados para uso directo del consumidor han incluido Siri de Apple , Alexa de Amazon , Google Assistant y Bixby de Samsung . ^[2] Además, las empresas de diversas industrias a menudo incorporan algún tipo de tecnología de asistente virtual en su servicio o soporte al cliente. ^[3]

Recientemente, la aparición de chatbots basados en inteligencia artificial , como ChatGPT , ha aumentado la capacidad y el interés en el campo de los productos y servicios de asistentes virtuales. ^[4]^[5]^[6]

Historia

Décadas experimentales: 1910-1980

Radio Rex fue el primer juguete activado por voz, patentado en 1916 ^[7] y lanzado en 1922. ^[8] Era un juguete de madera con forma de perro que salía de su casa cuando lo llamaban por su nombre.

En 1952, Bell Labs presentó "Audrey", la máquina de reconocimiento automático de dígitos. Ocupaba un bastidor de relés de seis pies de alto, consumía una cantidad considerable de energía, tenía un montón de cables y presentaba los innumerables problemas de mantenimiento asociados con los circuitos complejos de válvulas de vacío. Podía reconocer las unidades fundamentales del habla, los fonemas. Se limitaba al reconocimiento preciso de los dígitos pronunciados por los hablantes designados. Por lo tanto, podía usarse para marcar por voz, pero en la mayoría de los casos, la marcación mediante pulsadores era más barata y rápida que decir los dígitos consecutivos. ^[9]

Otra herramienta temprana que fue capaz de realizar reconocimiento de voz digital fue la calculadora activada por voz IBM Shoebox , presentada al público general durante la Feria Mundial de Seattle de 1962 después de su lanzamiento inicial al mercado en 1961. Esta primera computadora, desarrollada casi 20 años antes de la introducción de la primera computadora personal IBM en 1981, podía reconocer 16 palabras habladas y los dígitos del 0 al 9.

El primer programa informático de procesamiento de lenguaje natural o chatbot ELIZA fue desarrollado por el profesor del MIT Joseph Weizenbaum en la década de 1960. Fue creado para "demostrar que la comunicación entre el hombre y la máquina era superficial". ^[10] ELIZA utilizó una metodología de búsqueda y sustitución de patrones en respuestas predefinidas para simular una conversación, lo que dio una ilusión de comprensión por parte del programa.

Según se informa, la propia secretaria de Weizenbaum le pidió a Weizenbaum que saliera de la habitación para que ella y ELIZA pudieran tener una conversación real. Weizenbaum se sorprendió por esto y más tarde escribió: "No me había dado cuenta... de que exposiciones extremadamente breves a un programa informático relativamente simple podían inducir pensamientos delirantes poderosos en personas completamente normales". ^[11]

Esto dio nombre al efecto ELIZA , la tendencia a asumir inconscientemente que los comportamientos de las computadoras son análogos a los comportamientos humanos; es decir, la antropomorfización, un fenómeno presente en las interacciones humanas con asistentes virtuales.

El siguiente hito en el desarrollo de la tecnología de reconocimiento de voz se logró en la década de 1970 en la Universidad Carnegie Mellon de Pittsburgh (Pensilvania), con el apoyo sustancial del Departamento de Defensa de los Estados Unidos y su agencia DARPA , que financió durante cinco años un programa de investigación sobre comprensión del habla, cuyo objetivo era alcanzar un vocabulario mínimo de 1.000 palabras. En el programa participaron empresas y el mundo académico, entre ellas IBM, la Universidad Carnegie Mellon (CMU) y el Instituto de Investigación de Stanford.

El resultado fue "Harpy", que dominaba unas 1000 palabras, el vocabulario de un niño de tres años, y podía entender frases. Podía procesar el habla que seguía estructuras de vocabulario, pronunciación y gramática preprogramadas para determinar qué secuencias de palabras tenían sentido juntas, reduciendo así los errores de reconocimiento del habla.

En 1986, Tangora fue una versión mejorada de Shoebox: una máquina de escribir que reconocía la voz. Llevaba el nombre del mecanógrafo más rápido del mundo en ese momento, tenía un vocabulario de 20.000 palabras y utilizaba la predicción para decidir el resultado más probable en función de lo que se decía en el pasado. El enfoque de IBM se basaba en un modelo oculto de Markov , que añade estadísticas a las técnicas de procesamiento de señales digitales. El método permite predecir los fonemas más probables que siguen a un fonema determinado. Aun así, cada hablante tenía que entrenar individualmente a la máquina de escribir para que reconociera su voz y hiciera una pausa entre cada palabra.

En 1983 Gus Searcy inventó el "Butler In A Box", un sistema electrónico de control de voz para el hogar. ^[12]

Nacimiento de los asistentes virtuales inteligentes: década de 1990-2010

En la década de 1990, la tecnología de reconocimiento de voz digital se convirtió en una característica de la computadora personal, con IBM , Philips y Lernout & Hauspie compitiendo por los clientes. Mucho más tarde, el lanzamiento al mercado del primer teléfono inteligente IBM Simon en 1994 sentó las bases para los asistentes virtuales inteligentes tal como los conocemos hoy. ^{[ cita requerida ]}

En 1997, el software Naturally Speaking de Dragon podía reconocer y transcribir el habla humana natural sin pausas entre cada palabra en un documento a una velocidad de 100 palabras por minuto. Una versión de Naturally Speaking todavía está disponible para descargar y todavía la utilizan, por ejemplo, muchos médicos de los EE. UU. y el Reino Unido para documentar sus historiales médicos. ^{[ cita requerida ]}

En 2001, Colloquis lanzó públicamente SmarterChild en plataformas como AIM y MSN Messenger . Si bien era un programa totalmente basado en texto, SmarterChild podía jugar, consultar el clima, buscar datos y conversar con los usuarios hasta cierto punto. ^[13]

El primer asistente virtual digital moderno instalado en un teléfono inteligente fue Siri , que se presentó como una característica del iPhone 4S el 4 de octubre de 2011. ^[14] Apple Inc. desarrolló Siri luego de la adquisición en 2010 de Siri Inc. , una escisión de SRI International , que es un instituto de investigación financiado por DARPA y el Departamento de Defensa de los Estados Unidos . ^[15] Su objetivo era ayudar en tareas como enviar un mensaje de texto, hacer llamadas telefónicas, verificar el clima o configurar una alarma. Con el tiempo, se ha desarrollado para proporcionar recomendaciones de restaurantes, buscar en Internet y proporcionar instrucciones para llegar en automóvil. ^{[ cita requerida ]}

En noviembre de 2014, Amazon anunció Alexa junto con el Echo. ^[16]

En abril de 2017, Amazon lanzó un servicio para crear interfaces conversacionales para cualquier tipo de asistente o interfaz virtual.

Inteligencia artificial y modelos de lenguaje: década de 2020 a la actualidad

En la década de 2020, los sistemas de inteligencia artificial (IA) como ChatGPT han ganado popularidad por su capacidad de generar respuestas similares a las humanas a conversaciones basadas en texto. En febrero de 2020, Microsoft presentó su Generación de lenguaje natural de Turing (T-NLG), que entonces era el "modelo de lenguaje más grande jamás publicado con 17 mil millones de parámetros". ^[17] El 30 de noviembre de 2022, ChatGPT se lanzó como prototipo y rápidamente atrajo la atención por sus respuestas detalladas y articuladas en muchos dominios del conocimiento. La llegada de ChatGPT y su introducción al público en general aumentaron el interés y la competencia en el espacio. En febrero de 2023, Google comenzó a presentar un servicio experimental llamado "Bard" que se basa en su programa LaMDA para generar respuestas de texto a preguntas formuladas en función de la información recopilada de la web .

Si bien ChatGPT y otros chatbots generalizados basados en la última IA generativa son capaces de realizar diversas tareas asociadas con los asistentes virtuales, también existen formas más especializadas de dicha tecnología que están diseñadas para abordar situaciones o necesidades más específicas. ^[18]^[4]

Método de interacción

Los asistentes virtuales funcionan a través de:

Texto, incluyendo: chat en línea (especialmente en una aplicación de mensajería instantánea u otra aplicación), texto SMS , correo electrónico u otro canal de comunicación basado en texto, por ejemplo los asistentes virtuales inteligentes de Conversica para empresas. ^[19]
Voz: por ejemplo, con Amazon Alexa ^[20] en dispositivos Amazon Echo , Siri en un iPhone , Google Assistant en dispositivos Android habilitados para Google o Bixby en dispositivos Samsung.
Imágenes: algunos asistentes, como Google Assistant (que incluye Google Lens ) y Bixby en la serie Samsung Galaxy , tienen la capacidad adicional de realizar el procesamiento de imágenes para reconocer objetos en imágenes.

Muchos asistentes virtuales son accesibles a través de múltiples métodos, lo que ofrece versatilidad en la forma en que los usuarios pueden interactuar con ellos, ya sea a través del chat, comandos de voz u otras tecnologías integradas.

Los asistentes virtuales utilizan el procesamiento del lenguaje natural (PLN) para hacer coincidir el texto o la voz del usuario con los comandos ejecutables. Algunos aprenden continuamente mediante técnicas de inteligencia artificial , como el aprendizaje automático y la inteligencia ambiental .

Para activar un asistente virtual mediante la voz, se puede utilizar una palabra de activación. Se trata de una palabra o un grupo de palabras como "Hola Siri", "OK Google" o "Hola Google", "Alexa" y "Hola Microsoft". ^[21] A medida que los asistentes virtuales se vuelven más populares, aumentan los riesgos legales involucrados. ^[22]^{: 815}

Dispositivos y objetos

Los asistentes virtuales pueden integrarse en muchos tipos de plataformas o, como Amazon Alexa, en varias de ellas:

En dispositivos como altavoces inteligentes como Amazon Echo, Google Home y Apple HomePod
En aplicaciones de mensajería instantánea tanto en teléfonos inteligentes como a través de la Web, por ejemplo, M (asistente virtual) tanto en las aplicaciones de Facebook como de Facebook Messenger o a través de la Web.
Integrado en un sistema operativo (SO) móvil , como Siri de Apple en dispositivos iOS y BlackBerry Assistant en dispositivos BlackBerry 10 , o en un sistema operativo de escritorio como Cortana en el sistema operativo Microsoft Windows .
Integrado en un teléfono inteligente independientemente del sistema operativo, como Bixby en el Samsung Galaxy S8 y Note 8. [ ^23]
Dentro de las plataformas de mensajería instantánea, asistentes de organizaciones específicas, como el Aerobot de Aeroméxico en Facebook Messenger o la Secretaria de WeChat .
Dentro de aplicaciones móviles de empresas específicas y otras organizaciones, como Dom de Domino's Pizza ^[24]
En electrodomésticos, ^[25] automóviles, ^[26] y tecnología portátil . ^[27]
Las generaciones anteriores de asistentes virtuales solían trabajar en sitios web, como Ask Jenn de Alaska Airlines , ^[28] o en sistemas de respuesta de voz interactiva (IVR) como el IVR de American Airlines de Nuance . ^[29]

Servicios

Los asistentes virtuales pueden proporcionar una amplia variedad de servicios, entre los que se incluyen: ^[30]

Proporcionar información como el clima, datos de, por ejemplo, Wikipedia o IMDb , configurar una alarma, hacer listas de tareas pendientes y listas de compras.
Reproducir música desde servicios de streaming como Spotify y Pandora ; reproducir estaciones de radio; leer audiolibros
Reproducir vídeos, programas de TV o películas en televisores, transmitiendo desde, por ejemplo, Netflix
Comercio conversacional (ver abajo)
Facilitar las interacciones del público con el gobierno (ver Inteligencia artificial en el gobierno )
Complementar y/o reemplazar a los especialistas humanos en atención al cliente ^{[31] en ámbitos como la atención médica, las ventas y la banca. Un informe estimó que un asistente en línea automatizado produjo una reducción del 30% en la carga de trabajo de un}centro de llamadas provisto por humanos . ^[32]
Mejore la experiencia de conducción al permitir la interacción con asistentes virtuales como Siri y Alexa mientras está en el automóvil.

Comercio conversacional

El comercio conversacional es el comercio electrónico a través de diversos medios de mensajería, incluidos los asistentes de voz ^[33], pero también el chat en vivo en sitios web de comercio electrónico , el chat en vivo en aplicaciones de mensajería como WeChat , Facebook Messenger y WhatsApp ^[34] y los chatbots en aplicaciones de mensajería o sitios web.

Atención al cliente

Un asistente virtual puede trabajar con el equipo de atención al cliente de una empresa para brindar asistencia las 24 horas, los 7 días de la semana, a los clientes. Ofrece respuestas rápidas, lo que mejora la experiencia del cliente.

Servicios de terceros

Amazon habilita las “Habilidades” de Alexa y las “Acciones” de Google, esencialmente aplicaciones que se ejecutan en las plataformas del asistente.

Privacidad

Los asistentes virtuales tienen una variedad de problemas de privacidad asociados con ellos. Funciones como la activación por voz plantean una amenaza, ya que dichas funciones requieren que el dispositivo esté siempre escuchando. ^[35] Se han propuesto modos de privacidad como el botón de seguridad virtual para crear una autenticación multicapa para los asistentes virtuales. ^[36]

Asistente de Google

La política de privacidad de Google Assistant establece que no almacena los datos de audio sin el permiso del usuario, pero puede almacenar las transcripciones de las conversaciones para personalizar su experiencia. La personalización se puede desactivar en la configuración. Si un usuario desea que Google Assistant almacene datos de audio, puede ir a Actividad de voz y audio (VAA) y activar esta función. Los archivos de audio se envían a la nube y Google los utiliza para mejorar el rendimiento de Google Assistant, pero solo si la función VAA está activada. ^[37]

Amazon Alexa

La política de privacidad del asistente virtual de Amazon, Alexa, establece que solo escucha conversaciones cuando se utiliza su palabra de activación (como Alexa, Amazon, Echo). Comienza a grabar la conversación después de que se indique una palabra de activación y deja de grabar después de 8 segundos de silencio. Envía la conversación grabada a la nube. Es posible eliminar la grabación de la nube visitando 'Privacidad de Alexa' en 'Alexa'. ^[38]

Siri de Apple

Apple afirma que no graba audio para mejorar Siri, sino que utiliza transcripciones. Los datos de las transcripciones solo se envían si se consideran importantes para el análisis. Los usuarios pueden optar por no hacerlo en cualquier momento si no quieren que Siri envíe las transcripciones en la nube. ^[39]

Interés del consumidor

Se presume que el valor añadido es permitir una nueva forma de interacción

El valor añadido de los asistentes virtuales puede venir entre otros de lo siguiente:

La comunicación por voz puede representar a veces la comunicación hombre-máquina óptima :

Es conveniente: hay algunos sectores donde la voz es la única vía de comunicación posible y, más generalmente, permite liberar ambas manos y la visión potencialmente para realizar otra actividad en paralelo, o ayuda también a personas discapacitadas.
Es más rápido: la voz es más eficiente que escribir con un teclado: podemos hablar hasta 200 palabras por minuto frente a las 60 que se obtienen escribiendo con un teclado. También es más natural, por lo que requiere menos esfuerzo (sin embargo, leer un texto puede alcanzar las 700 palabras por minuto). ^[40]

Los asistentes virtuales ahorran mucho tiempo gracias a la automatización: pueden concertar citas o leer las noticias mientras el consumidor hace otra cosa. También es posible pedirle al asistente virtual que programe reuniones, lo que ayuda a organizar el tiempo. Los diseñadores de los nuevos planificadores digitales explicaron la ambición que tenían de que estos calendarios programaran vidas para que el consumidor utilizara su tiempo de manera más eficiente, a través de procesos de aprendizaje automático, y la organización completa del tiempo de trabajo y el tiempo libre. Como ejemplo, cuando el consumidor expresa el deseo de programar un descanso, el asistente virtual lo programará en un momento óptimo para este propósito (por ejemplo, en un momento de la semana en el que sea menos productivo), con el objetivo adicional a largo plazo de poder programar y organizar el tiempo libre del consumidor, para asegurarle una eficiencia laboral óptima. ^[41]

Interés percibido

Según un estudio reciente (2019), las dos razones por las que los consumidores utilizan asistentes virtuales son la utilidad percibida y el disfrute percibido. El primer resultado de este estudio es que tanto la utilidad percibida como el disfrute percibido tienen una influencia equivalente y muy fuerte en la disposición del consumidor a utilizar un asistente virtual.
El segundo resultado de este estudio es que:

La calidad del contenido proporcionado tiene una influencia muy fuerte en la utilidad percibida y en el disfrute percibido.
El atractivo visual tiene una influencia muy fuerte en el disfrute percibido.
La automatización tiene una fuerte influencia en la utilidad percibida. ^[42]

Controversias

Controversias sobre la inteligencia artificial

Los asistentes virtuales estimulan la burbuja de filtros : en el caso de las redes sociales , los algoritmos de los asistentes virtuales están entrenados para mostrar datos pertinentes y descartar otros en función de las actividades anteriores del consumidor: los datos pertinentes son los que interesarán o agradarán al consumidor. Como resultado, quedan aislados de los datos que no coinciden con sus puntos de vista, aislándolos efectivamente en su propia burbuja intelectual y reforzando sus opiniones. Se sabe que este fenómeno refuerza las noticias falsas y las cámaras de eco. ^[43]
A veces también se critica a los asistentes virtuales por estar sobrevalorados. En particular, A. Casilli señala que la IA de los asistentes virtuales no es inteligente ni artificial por dos razones:

No son inteligentes porque lo único que hacen es ser asistentes del humano, y solo realizan tareas que un humano podría hacer fácilmente, y en un espectro muy limitado de acciones: buscar, clasificar y presentar información, ofertas o documentos. Además, los asistentes virtuales no son capaces de tomar decisiones por sí solos ni de anticiparse a los acontecimientos.
Y no artificiales porque serían imposibles sin el etiquetado humano a través del microtrabajo . ^[44]

Implicaciones éticas

En 2019, Antonio A. Casilli , sociólogo francés , criticó la inteligencia artificial y, en particular, los asistentes virtuales de la siguiente manera:

En un primer nivel, el hecho de que el consumidor proporcione datos gratuitos para el entrenamiento y la mejora del asistente virtual, a menudo sin saberlo, es éticamente perturbador.

Pero en un segundo nivel, podría ser aún más perturbador desde el punto de vista ético saber cómo se entrenan estas IA con estos datos.

Esta inteligencia artificial se entrena a través de redes neuronales , que requieren una enorme cantidad de datos etiquetados. Sin embargo, estos datos necesitan ser etiquetados a través de un proceso humano, lo que explica el auge del microtrabajo en la última década. Es decir, utilizar de forma remota a algunas personas en todo el mundo para realizar algunas tareas repetitivas y muy simples por unos pocos centavos, como escuchar los datos de voz de un asistente virtual y escribir lo que se dice. El microtrabajo ha sido criticado por la inseguridad laboral que causa y por la falta total de regulación: el salario promedio era de 1,38 dólares la hora en 2010, ^[45] y no proporciona ni atención médica ni beneficios de jubilación, pago por enfermedad ni salario mínimo . Por lo tanto, los asistentes virtuales y sus diseñadores son controvertidos por estimular la inseguridad laboral, y las IA que proponen siguen siendo humanas en la forma en que serían imposibles sin el microtrabajo de millones de trabajadores humanos. ^[44]

Las preocupaciones en materia de privacidad surgen por el hecho de que los comandos de voz están disponibles para los proveedores de asistentes virtuales en forma no cifrada y, por lo tanto, pueden compartirse con terceros y procesarse de manera no autorizada o inesperada. ^[46] Además del contenido lingüístico del habla grabada, la forma de expresión y las características de voz de un usuario pueden contener implícitamente información sobre su identidad biométrica, rasgos de personalidad, forma corporal, estado de salud física y mental, sexo, género, estados de ánimo y emociones, estatus socioeconómico y origen geográfico. ^[47]

Plataformas para desarrolladores

Entre las plataformas de desarrollo más destacadas para asistentes virtuales se incluyen:

Amazon Lex se abrió a los desarrolladores en abril de 2017. Implica una tecnología de comprensión del lenguaje natural combinada con reconocimiento automático de voz y se presentó en noviembre de 2016. ^[48]
Google ofrece las plataformas Actions on Google y Dialogflow para que los desarrolladores creen "Acciones" para Google Assistant ^[49]
Apple ofrece SiriKit para que los desarrolladores creen extensiones para Siri
Watson de IBM , aunque a veces se habla de él como un asistente virtual, es de hecho una plataforma y una comunidad de inteligencia artificial completa que impulsa algunos asistentes virtuales, chatbots y muchos otros tipos de soluciones. ^[50]^[51]

Generaciones anteriores

En generaciones anteriores de asistentes virtuales basados en chat de texto, el asistente a menudo estaba representado por un avatar (también conocido como personaje interactivo en línea o personaje automatizado ); esto se conocía como un agente encarnado .

Relevancia económica

Para particulares

Las experiencias digitales habilitadas por asistentes virtuales se consideran entre los principales avances tecnológicos recientes y las tendencias de consumo más prometedoras. Los expertos afirman que las experiencias digitales alcanzarán un peso de estatus comparable a las experiencias "reales", si no se vuelven más buscadas y apreciadas. ^[52] La tendencia se verifica por un alto número de usuarios frecuentes y el crecimiento sustancial de la cantidad de usuarios de asistentes digitales virtuales en todo el mundo. A mediados de 2017, se estima que la cantidad de usuarios frecuentes de asistentes virtuales digitales es de alrededor de 1 mil millones en todo el mundo. ^[53] Además, se puede observar que la tecnología de asistentes digitales virtuales ya no se limita a las aplicaciones de teléfonos inteligentes, sino que está presente en muchos sectores industriales (incluidos automoción , telecomunicaciones, comercio minorista , atención médica y educación). ^[54] En respuesta a los importantes gastos de I+D de las empresas en todos los sectores y una creciente implementación de dispositivos móviles, se prevé que el mercado de la tecnología de reconocimiento de voz crezca a una CAGR del 34,9% a nivel mundial durante el período de 2016 a 2024 y, por lo tanto, supere un tamaño de mercado global de 7500 millones de dólares estadounidenses para 2024. ^[54] Según un estudio de Ovum , se proyecta que la "base instalada de asistentes digitales nativos" supere a la población mundial para 2021, con 7500 millones de dispositivos activos con capacidad de IA de voz. ^[55] Según Ovum, para ese momento "Google Assistant dominará el mercado de dispositivos con capacidad de IA de voz con una participación de mercado del 23,3%, seguido por Bixby de Samsung (14,5%), Siri de Apple (13,1%), Alexa de Amazon (3,9%) y Cortana de Microsoft (2,3%)". ^[55]

Teniendo en cuenta la distribución regional de los líderes del mercado, se espera que las empresas norteamericanas (por ejemplo, Nuance Communications , IBM , eGain ) dominen la industria en los próximos años, debido al impacto significativo de BYOD ( Bring Your Own Device ) y los modelos de negocio de movilidad empresarial. Además, se espera que la creciente demanda de plataformas asistidas por teléfonos inteligentes impulse aún más el crecimiento de la industria de asistentes virtuales inteligentes (IVA) de América del Norte. A pesar de su menor tamaño en comparación con el mercado norteamericano, se prevé que la industria de asistentes virtuales inteligentes de la región Asia-Pacífico , con sus principales actores ubicados en India y China, crezca a una tasa de crecimiento anual del 40% (por encima del promedio mundial) durante el período 2016-2024. ^[54]

Oportunidad económica para las empresas

Los asistentes virtuales no deben ser vistos únicamente como un dispositivo para particulares, ya que podrían tener una utilidad económica real para las empresas. Por ejemplo, un asistente virtual puede asumir el papel de un asistente siempre disponible con un conocimiento enciclopédico, que puede organizar reuniones, verificar inventarios y verificar información. Los asistentes virtuales son tanto más importantes cuanto que su integración en las pequeñas y medianas empresas a menudo consiste en un primer paso sencillo a través de la adaptación y el uso más global de Internet de las cosas (IoT) . De hecho, las tecnologías de IoT son percibidas en primer lugar por las pequeñas y medianas empresas como tecnologías de importancia crítica, pero demasiado complicadas, arriesgadas o costosas para su uso. ^[56]

Seguridad

En mayo de 2018, investigadores de la Universidad de California, Berkeley , publicaron un artículo que mostraba que los comandos de audio indetectables para el oído humano podrían incrustarse directamente en la música o el texto hablado, manipulando así a los asistentes virtuales para que realicen ciertas acciones sin que el usuario se dé cuenta. ^[57] Los investigadores realizaron pequeños cambios en los archivos de audio, que cancelaron los patrones de sonido que los sistemas de reconocimiento de voz deben detectar. Estos fueron reemplazados por sonidos que serían interpretados de manera diferente por el sistema y le ordenarían marcar números de teléfono, abrir sitios web o incluso transferir dinero. ^[57] La posibilidad de esto se conoce desde 2016, ^[57] y afecta a los dispositivos de Apple, Amazon y Google. ^[58]

Además de las acciones no intencionales y la grabación de voz, otro riesgo de seguridad y privacidad asociado con los asistentes virtuales inteligentes son los comandos de voz maliciosos: un atacante que se hace pasar por un usuario y emite comandos de voz maliciosos para, por ejemplo, desbloquear una puerta inteligente para obtener acceso no autorizado a una casa o garaje o pedir artículos en línea sin el conocimiento del usuario. Aunque algunos asistentes virtuales inteligentes proporcionan una función de entrenamiento de voz para evitar dicha suplantación, puede resultar difícil para el sistema distinguir entre voces similares. Por lo tanto, una persona malintencionada que pueda acceder a un dispositivo habilitado para asistentes virtuales inteligentes podría engañar al sistema para que piense que es el verdadero propietario y llevar a cabo actos delictivos o maliciosos. ^[59]

Comparación de asistentes notables

Véase también

Referencias

^ Hoy, Matthew B. (2018). "Alexa, Siri, Cortana y más: una introducción a los asistentes de voz". Medical Reference Services Quarterly . 37 (1): 81–88. doi :10.1080/02763869.2018.1404391. PMID 29327988. S2CID 30809087.
^ "Siri vs Alexa vs Google Assistant vs Bixby: ¿cuál es el mejor?". Android Authority . 29 de enero de 2024.
^ "La magia de los asistentes virtuales y su impacto en el servicio al cliente".
^ ab "Lo único para lo que definitivamente deberías usar un chatbot con inteligencia artificial". 7 de abril de 2023.
^ "La IA significa que todo el mundo tendrá un asistente personal de 'cuello blanco', dice Bill Gates".
^ "Chat GPT: ¿Qué es?". uca.edu . Consultado el 8 de febrero de 2024 .
^ US 1209636, Christian Berger, "Controlador de circuito operado por sonido", emitido el 19 de diciembre de 1916, asignado a Submarine Wireless Company
^ Markowitz, Judith. "Juguetes que tienen voz". SpeechTechMag .
^ Moskvitch, Katia. "Las máquinas que aprendieron a escuchar". BBC . Consultado el 5 de mayo de 2020 .
^ Epstein, J; Klinkenberg, W. D (1 de mayo de 2001). "De Eliza a Internet: una breve historia de la evaluación informatizada". Computers in Human Behavior . 17 (3): 295–314. doi :10.1016/S0747-5632(01)00004-8. ISSN 0747-5632.
^ Weizenbaum, Joseph (1976). Poder de las computadoras y razón humana: del juicio al cálculo. Biblioteca Oliver Wendell Holmes, Phillips Academy. San Francisco: WH Freeman.
^ "La IA de 15.000 dólares de 1983". YouTube . 6 de marzo de 2024.
^ «Smartphone: tu nuevo asistente personal – Orange Pop». Archivado desde el original el 10 de julio de 2017 . Consultado el 5 de mayo de 2020 .
^ Murph, Darren (4 de octubre de 2011). "iPhone 4S: análisis práctico". Engadget.com . Consultado el 10 de diciembre de 2017 .
^ "Reportaje: Von IBM Shoebox bis Siri: 50 Jahre Spracherkennung - WELT" [De IBM Shoebox a Siri: 50 años de reconocimiento de voz]. Die Welt (en alemán). Welt.de. 20 de abril de 2012 . Consultado el 10 de diciembre de 2017 .
^ Kundu, Kishalaya (2023). "Amazon amplía la línea Echo con un nuevo altavoz inteligente, auriculares y más". XDA . Consultado el 26 de mayo de 2023 .
^ Sterling, Bruce (13 de febrero de 2020). «Web Semantics: Microsoft Project Turing introduce Turing Natural Language Generation (T-NLG)». Wired . ISSN 1059-1028 . Consultado el 31 de julio de 2020 .
^ "GPT-4 conquista el mundo - Lista de empresas que integraron el chatbot". 21 de marzo de 2023.
^ "Conversica recauda 31 millones de dólares en financiación de serie C para impulsar la expansión de la inteligencia artificial conversacional para empresas". Bloomberg.com . 30 de octubre de 2018 . Consultado el 23 de octubre de 2020 .
^ Herrera, Sebastian (26 de septiembre de 2019). «Amazon extiende el alcance de Alexa a los wearables». The Wall Street Journal . Consultado el 26 de septiembre de 2019 .
^ "S7617 – Desarrollo de su propio motor de palabras de activación como 'Alexa' y 'OK Google'". Conferencia de tecnología de GPU . Consultado el 17 de julio de 2017 .
^ Van Loo, Rory (1 de marzo de 2019). "Perfección del mercado digital". Michigan Law Review . 117 (5): 815. doi : 10.36644/mlr.117.5.digital . S2CID 86402702.
^ La, Lynn (27 de febrero de 2017). "Todo lo que Google Assistant puede hacer en el Pixel". CNET . Consultado el 10 de diciembre de 2017 .
^ Morrison, Maureen (5 de octubre de 2014). "Domino's lanza una aplicación de pedidos por voz en Fast-Food First | CMO Strategy". AdAge . Consultado el 10 de diciembre de 2017 .
^ O'Shea, Dan (4 de enero de 2017). "LG presenta un refrigerador inteligente con pedidos de comestibles habilitados por Amazon Alexa". Retail Dive . Consultado el 10 de diciembre de 2017 .
^ Gibbs, Samuel (7 de febrero de 2017). «Alexa de Amazon escapa del Echo y se mete en los coches | Tecnología». The Guardian . Consultado el 10 de diciembre de 2017 .
^ "¿Qué es Google Assistant, cómo funciona y qué dispositivos lo ofrecen?". Pocket-lint. 6 de octubre de 2017. Consultado el 10 de diciembre de 2017 .
^ "'Ask Jenn', sitio web de Alaska Airlines". Alaska Airlines. 2 de enero de 2017. Consultado el 10 de diciembre de 2017 .
^ AT&T Tech Channel (26 de junio de 2013). «American Airlines (US Airways): la primera aerolínea estadounidense en implementar el lenguaje natural del habla» (vídeo), Nuance Enterprise en YouTube. Archivado desde el original el 21 de diciembre de 2021. Consultado el 10 de diciembre de 2017 – a través de YouTube. Título de YouTube: Airline Information System, 1989 – AT&T Archives – reconocimiento de voz
^ Martin, Taylor; Priest, David (10 de septiembre de 2017). «La lista completa de comandos de Alexa hasta el momento». CNET . Consultado el 10 de diciembre de 2017 .
^ Kongthon, Alisa; Sangkeettrakarn, Chatchawal; Kongyoung, Sarawoot; Haruechaiyasak, Choochart (1 de enero de 2009). "Implementación de un sistema de soporte técnico en línea basado en un agente conversacional". Actas de la Conferencia Internacional sobre Gestión de Ecosistemas Digitales Emergentes . MEDES '09. Nueva York, NY, EE. UU.: ACM. pp. 69:450–69:451. doi :10.1145/1643823.1643908. ISBN 9781605588292.S2CID 1046438 .
^ O'Donnell, Anthony (3 de junio de 2010). "El nuevo "asistente virtual en línea" de Aetna". Seguros y tecnología. Archivado desde el original el 7 de junio de 2010.
^ "Cómo preparar tus productos y tu marca para el comercio conversacional". 6 de marzo de 2018.
^ Taylor, Glenn (5 de marzo de 2018). "La gran oportunidad del comercio minorista: el 87 % de los consumidores estadounidenses comprenden el poder del comercio conversacional – Retail TouchPoints".
^ Zhang, Guoming; Yan, Chen; Ji, Xiaoyu; Zhang, Tianchen; Zhang, Taimin; Xu, Wenyuan (2017). "DolphinAttack". Actas de la Conferencia ACM SIGSAC de 2017 sobre seguridad informática y de las comunicaciones - CCS '17 . págs. 103–117. arXiv : 1708.09537 . doi :10.1145/3133956.3134052. ISBN . 9781450349468.S2CID2419970 .
^ Lei, Xinyu; Tu, Guan-Hua; Liu, Alex X.; Li, Chi-Yu; Xie, Tian (2017). "La inseguridad de los asistentes de voz digitales domésticos: Amazon Alexa como caso de estudio". arXiv : 1712.03327 [cs.CR].
^ "Haciendo más para proteger tu privacidad con el Asistente". Google . 23 de septiembre de 2019 . Consultado el 27 de febrero de 2020 .
^ "Alexa, dispositivos Echo y tu privacidad". Amazon.com . Consultado el 27 de febrero de 2020 .
^ "Mejora de la protección de la privacidad de Siri". Apple Newsroom . Consultado el 27 de febrero de 2020 .
^ Minker, W.; Neel, F. (2002). "Desarrollo de tecnologías vocales". El trabajo humano . 65 (3): 261. doi : 10.3917/th.653.0261 . ISSN 0041-1868.
^ Wajcman, Judy (2019). "La arquitectura digital de la gestión del tiempo" (PDF) . Ciencia, tecnología y valores humanos . 44 (2): 315–337. doi :10.1177/0162243918795041. S2CID 149648777.
^ Yang, Heetae; Lee, Hwansoo (26 de junio de 2018). "Comprensión del comportamiento del usuario de los dispositivos de asistente personal virtual". Sistemas de información y gestión del comercio electrónico . 17 (1): 65–87. doi :10.1007/s10257-018-0375-1. ISSN 1617-9846. S2CID 56838915.
^ Tisseron, Serge (2019). "La familia sous écoute". L'École des Parents . n° 632 (3): 16-18. doi :10.3917/epar.632.0016. ISSN 0424-2238. S2CID 199344092. {{cite journal}}: |volume=tiene texto extra ( ayuda )
^ ab Casilli, Antonio A. (2019). En asistente de los robots. Enquête sur le travail du clic . Ediciones Seuil. ISBN 978-2-02-140188-2.OCLC 1083583353 .
^ Horton, John Joseph; Chilton, Lydia B. (2010). "La economía laboral del crowdsourcing pagado". Actas de la 11.ª conferencia de la ACM sobre comercio electrónico . EC '10. Nueva York, Nueva York, EE. UU.: ACM Press. pp. 209–218. arXiv : 1001.0627 . doi :10.1145/1807342.1807376. ISBN . 978-1-60558-822-3.S2CID18237602 .
^ "Apple, Google y Amazon podrían haber violado su privacidad al revisar los comandos del asistente digital". Fortune . 5 de agosto de 2019 . Consultado el 13 de mayo de 2020 .
^ Kröger, Jacob Leon; Lutz, Otto Hans-Martin; Raschke, Philip (2020). "Implicaciones de privacidad del análisis de voz y habla: divulgación de información por inferencia". Gestión de la privacidad y la identidad. Datos para una vida mejor: IA y privacidad . IFIP Avances en tecnología de la información y la comunicación. Vol. 576. págs. 242–258. doi : 10.1007/978-3-030-42504-3_16 . ISBN 978-3-030-42503-6. ISSN 1868-4238.
^ "Amazon Lex, la tecnología detrás de Alexa, se abre a los desarrolladores". TechCrunch. 20 de abril de 2017. Consultado el 10 de diciembre de 2017 .
^ "Acciones en Google | Google Developers" . Consultado el 10 de diciembre de 2017 .
^ "Watson: historias sobre cómo la IA y Watson están transformando los negocios y nuestro mundo". Ibm.com . Consultado el 10 de diciembre de 2017 .
^ Memeti, Suejb; Pllana, Sabri (enero de 2018). "PAPA: un asistente de programación paralela impulsado por la tecnología de computación cognitiva de IBM Watson". Journal of Computational Science . 26 : 275–284. doi :10.1016/j.jocs.2018.01.001.
^ "5 tendencias de consumo para 2017". TrendWatching. 31 de octubre de 2016. Consultado el 10 de diciembre de 2017 .
^ Richter, Felix (26 de agosto de 2016). «Gráfico: Asistentes digitales: siempre a su servicio». Statista . Consultado el 10 de diciembre de 2017 .
^ abc «Virtual Assistant Industry Statistics». Global Market Insights. 30 de enero de 2017. Consultado el 10 de diciembre de 2017 .
^ ab "Los asistentes digitales virtuales superarán a la población mundial en 2021". ovum.informa.com . Consultado el 11 de mayo de 2018 .
^ Jones, Nory B.; Graham, C. Matt (febrero de 2018). "¿Puede la IoT ayudar a las pequeñas empresas?". Boletín de ciencia, tecnología y sociedad . 38 (1–2): 3–12. doi :10.1177/0270467620902365. ISSN 0270-4676. S2CID 214031256.
^ abc "Alexa y Siri pueden escuchar este comando oculto. Tú no". The New York Times . 10 de mayo de 2018. ISSN 0362-4331 . Consultado el 11 de mayo de 2018 .
^ "A medida que los asistentes de voz se generalizan, los investigadores advierten sobre vulnerabilidades". CNET . 10 de mayo de 2018 . Consultado el 11 de mayo de 2018 .
^ Chung, H.; Iorga, M.; Voas, J.; Lee, S. (2017). "Alexa, ¿puedo confiar en ti?". Computer . 50 (9): 100–104. doi :10.1109/MC.2017.3571053. ISSN 0018-9162. PMC 5714311 . PMID 29213147.
^ "Baidu presenta tres altavoces inteligentes con su asistente digital Duer". 8 de enero de 2018.
^ MSV, Janakiram (20 de agosto de 2015). «Conoce a Mycroft, la alternativa de código abierto a Amazon Echo». Forbes . Consultado el 27 de octubre de 2016 .