Asistente virtual

Un asistente virtual ( VA ) es un agente de software que puede realizar una variedad de tareas o servicios para un usuario basándose en las entradas del usuario, como comandos o preguntas, incluidas las verbales. Estas tecnologías suelen incorporar capacidades de chatbot para simular una conversación humana, como a través de un chat en línea , para facilitar la interacción con sus usuarios. La interacción puede realizarse a través de texto, interfaz gráfica o voz, ya que algunos asistentes virtuales pueden interpretar el habla humana y responder mediante voces sintetizadas.

En muchos casos, los usuarios pueden hacer preguntas a sus asistentes virtuales, controlar dispositivos domóticos y reproducción multimedia, y gestionar otras tareas básicas como correo electrónico, listas de tareas pendientes y calendarios, todo ello con comandos verbales. ^[1] En los últimos años, entre los asistentes virtuales destacados para uso directo del consumidor se incluyen Siri de Apple , Amazon Alexa , Google Assistant y Bixby de Samsung . ^[2] Además, las empresas de diversas industrias suelen incorporar algún tipo de tecnología de asistente virtual en su servicio o soporte al cliente. ^[3]

Recientemente, la aparición de chatbots basados en inteligencia artificial , como ChatGPT , ha aportado una mayor capacidad e interés al campo de los productos y servicios de asistentes virtuales. ^[4]^[5]^[6]

Historia

Décadas experimentales: décadas de 1910 a 1980

Radio Rex fue el primer juguete activado por voz, patentado en 1916 ^[7] y lanzado en 1922. ^[8] Era un juguete de madera con forma de perro que salía de su casa cuando lo llamaban por su nombre.

En 1952, Bell Labs presentó "Audrey", la máquina de reconocimiento automático de dígitos. Ocupaba un bastidor de relés de dos metros de altura, consumía una cantidad considerable de energía, tenía montones de cables y presentaba innumerables problemas de mantenimiento asociados con complejos circuitos de tubos de vacío. Podría reconocer las unidades fundamentales del habla, los fonemas. Se limitaba al reconocimiento preciso de los dígitos pronunciados por los hablantes designados. Por lo tanto, podría usarse para la marcación por voz, pero en la mayoría de los casos la marcación con botones era más barata y rápida, en lugar de decir los dígitos consecutivos. ^[9]

Otra de las primeras herramientas que permitió realizar reconocimiento de voz digital fue la calculadora IBM Shoebox activada por voz, presentada al público en general durante la Feria Mundial de Seattle de 1962 después de su lanzamiento inicial al mercado en 1961. Esta primera computadora, desarrollada casi 20 años antes de la introducción. del primer ordenador personal IBM en 1981, fue capaz de reconocer 16 palabras habladas y los dígitos del 0 al 9.

El primer programa informático de procesamiento del lenguaje natural , el chatbot ELIZA, fue desarrollado por el profesor del MIT Joseph Weizenbaum en los años 1960. Fue creado para "demostrar que la comunicación entre el hombre y la máquina era superficial". ^[10] ELIZA utilizó una metodología de coincidencia y sustitución de patrones en respuestas escritas para simular una conversación, lo que dio una ilusión de comprensión por parte del programa.

Según los informes, la propia secretaria de Weizenbaum le pidió a Weizenbaum que saliera de la habitación para que ella y ELIZA pudieran tener una conversación real. Weizenbaum se sorprendió por esto y escribió más tarde: "No me había dado cuenta... de que exposiciones extremadamente breves a un programa de computadora relativamente simple podrían inducir pensamientos delirantes poderosos en personas bastante normales. ^[11]

Esto dio nombre al efecto ELIZA , la tendencia a asumir inconscientemente que los comportamientos informáticos son análogos a los comportamientos humanos; es decir, la antropomorfización, fenómeno presente en las interacciones humanas con asistentes virtuales.

El siguiente hito en el desarrollo de la tecnología de reconocimiento de voz se logró en la década de 1970 en la Universidad Carnegie Mellon en Pittsburgh , Pensilvania, con el apoyo sustancial del Departamento de Defensa de los Estados Unidos y su agencia DARPA , que financió cinco años de un programa de investigación sobre la comprensión del habla, con el objetivo de alcanzar un vocabulario mínimo de 1.000 palabras. En el programa participaron empresas y académicos, incluidos IBM, la Universidad Carnegie Mellon (CMU) y el Instituto de Investigación de Stanford.

El resultado fue "Harpy", dominaba unas 1.000 palabras, el vocabulario de un niño de tres años y podía entender frases. Podría procesar el habla que seguía vocabulario, pronunciación y estructuras gramaticales preprogramadas para determinar qué secuencias de palabras tenían sentido juntas y reducir así los errores de reconocimiento de voz.

En 1986, Tangora fue una actualización de Shoebox, era una máquina de escribir con reconocimiento de voz. Lleva el nombre del mecanógrafo más rápido del mundo en ese momento, tenía un vocabulario de 20.000 palabras y usaba la predicción para decidir el resultado más probable en función de lo que se dijo en el pasado. El enfoque de IBM se basó en un modelo oculto de Markov , que añade estadísticas a las técnicas de procesamiento de señales digitales. El método permite predecir los fonemas más probables que siguen a un fonema determinado. Aun así, cada orador tuvo que entrenar individualmente la máquina de escribir para que reconociera su voz y hiciera pausas entre cada palabra.

En 1983, Gus Searcy inventó el "Butler In A Box", un sistema de control doméstico por voz electrónico. ^[12]

Nacimiento de los asistentes virtuales inteligentes: décadas de 1990 a 2010

En la década de 1990, la tecnología de reconocimiento de voz digital se convirtió en una característica de las computadoras personales con IBM , Philips y Lernout & Hauspie luchando por conseguir clientes. Mucho más tarde, el lanzamiento al mercado del primer teléfono inteligente IBM Simon en 1994 sentó las bases para los asistentes virtuales inteligentes tal como los conocemos hoy. ^{[ cita necesaria ]}

En 1997, el software Dragon's Naturally Speaking podía reconocer y transcribir el habla humana natural sin pausas entre cada palabra en un documento a una velocidad de 100 palabras por minuto. Una versión de Naturally Speaking todavía está disponible para descargar y todavía la utilizan hoy, por ejemplo, muchos médicos en los EE. UU. y el Reino Unido para documentar sus registros médicos. ^{[ cita necesaria ]}

En 2001 Colloquis lanzó públicamente SmarterChild , en plataformas como AIM y MSN Messenger . Si bien SmarterChild estaba completamente basado en texto, podía jugar, verificar el clima, buscar datos y conversar con los usuarios hasta cierto punto. ^[13]

El primer asistente virtual digital moderno instalado en un teléfono inteligente fue Siri , que se introdujo como una característica del iPhone 4S el 4 de octubre de 2011. ^[14] Apple Inc. desarrolló Siri tras la adquisición en 2010 de Siri Inc. , una escisión de SRI International , que es un instituto de investigación financiado por DARPA y el Departamento de Defensa de los Estados Unidos . ^[15] Su objetivo era ayudar en tareas como enviar un mensaje de texto, hacer llamadas telefónicas, consultar el tiempo o configurar una alarma. Con el tiempo, se ha desarrollado para ofrecer recomendaciones de restaurantes, realizar búsquedas en Internet y proporcionar indicaciones para llegar en coche. ^{[ cita necesaria ]}

En noviembre de 2014, Amazon anunció Alexa junto con Echo. ^[dieciséis]

En abril de 2017, Amazon lanzó un servicio para crear interfaces conversacionales para cualquier tipo de asistente o interfaz virtual.

Inteligencia artificial y modelos de lenguaje: década de 2020-presente

En la década de 2020, los sistemas de inteligencia artificial (IA) como ChatGPT ganaron popularidad por su capacidad para generar respuestas similares a las humanas a conversaciones basadas en texto. En febrero de 2020, Microsoft presentó su Turing Natural Language Generation (T-NLG), que era entonces el "modelo de lenguaje más grande jamás publicado con 17 mil millones de parámetros". ^[17] El 30 de noviembre de 2022, ChatGPT se lanzó como prototipo y rápidamente atrajo la atención por sus respuestas detalladas y articuladas en muchos dominios del conocimiento. La llegada de ChatGPT y su introducción al público en general aumentó el interés y la competencia en el espacio. En febrero de 2023, Google comenzó a presentar un servicio experimental llamado "Bard" que se basa en su programa LaMDA para generar respuestas de texto a preguntas formuladas en función de la información recopilada de la web .

Si bien ChatGPT y otros chatbots generalizados basados en la última IA generativa son capaces de realizar diversas tareas asociadas con asistentes virtuales, también existen formas más especializadas de dicha tecnología que están diseñadas para abordar situaciones o necesidades más específicas. ^[18]^[4]

Método de interacción

Los asistentes virtuales funcionan a través de:

Texto, incluido: chat en línea (especialmente en una aplicación de mensajería instantánea u otra aplicación), texto SMS , correo electrónico u otro canal de comunicación basado en texto, por ejemplo, los asistentes virtuales inteligentes para empresas de Conversica . ^[19]
Voz: por ejemplo con Amazon Alexa ^[20] en dispositivos Amazon Echo , Siri en un iPhone , Google Assistant en dispositivos Android habilitados para Google o Bixby en dispositivos Samsung.
Imágenes: algunos asistentes, como Google Assistant (que incluye Google Lens ) y Bixby en la serie Samsung Galaxy , tienen la capacidad adicional de realizar procesamiento de imágenes para reconocer objetos en las imágenes.

Se puede acceder a muchos asistentes virtuales a través de múltiples métodos, lo que ofrece versatilidad en la forma en que los usuarios pueden interactuar con ellos, ya sea a través de chat, comandos de voz u otras tecnologías integradas.

Los asistentes virtuales utilizan el procesamiento del lenguaje natural (NLP) para hacer coincidir el texto del usuario o la entrada de voz con comandos ejecutables. Algunos aprenden continuamente utilizando técnicas de inteligencia artificial , incluido el aprendizaje automático y la inteligencia ambiental .

Para activar un asistente virtual mediante la voz, se puede utilizar una palabra de activación. Se trata de una palabra o grupos de palabras como "Hola Siri", "OK Google" o "Hola Google", "Alexa" y "Hola Microsoft". ^[21] A medida que los asistentes virtuales se vuelven más populares, aumentan los riesgos legales involucrados. ^[22]^{: 815}

Dispositivos y objetos

Los asistentes virtuales pueden integrarse en muchos tipos de plataformas o, como Amazon Alexa, en varias de ellas:

En dispositivos como parlantes inteligentes como Amazon Echo, Google Home y Apple HomePod
En aplicaciones de mensajería instantánea tanto en teléfonos inteligentes como a través de la Web, por ejemplo, M (asistente virtual) en las aplicaciones de Facebook y Facebook Messenger o a través de la Web
Integrado en un sistema operativo (SO) móvil, como lo son Siri de Apple en dispositivos iOS y BlackBerry Assistant en dispositivos BlackBerry 10 , o en un sistema operativo de escritorio como Cortana en el sistema operativo Microsoft Windows.
Integrado en un teléfono inteligente independiente del sistema operativo, como lo es Bixby en el Samsung Galaxy S8 y Note 8 . ^[23]
Dentro de las plataformas de mensajería instantánea, asistentes de organizaciones específicas, como Aerobot de Aeroméxico en Facebook Messenger o WeChat Secretary.
Dentro de aplicaciones móviles de empresas específicas y otras organizaciones, como Dom de Domino's Pizza ^[24]
En electrodomésticos, ^[25] automóviles, ^[26] y tecnología portátil . ^[27]
Las generaciones anteriores de asistentes virtuales a menudo trabajaban en sitios web, como Ask Jenn de Alaska Airlines , ^[28] o en sistemas de respuesta de voz interactiva (IVR) como el IVR de Nuance de American Airlines . ^[29]

Servicios

Los asistentes virtuales pueden proporcionar una amplia variedad de servicios. Estos incluyen: ^[30]

Proporcione información como el clima, datos de, por ejemplo, Wikipedia o IMDb , configure una alarma, haga listas de tareas pendientes y listas de compras.
Reproduce música desde servicios de streaming como Spotify y Pandora ; reproducir estaciones de radio; leer audiolibros
Reproduzca vídeos, programas de televisión o películas en televisores, transmitiéndolos desde, por ejemplo, Netflix
Comercio conversacional (ver más abajo)
Ayudar a las interacciones públicas con el gobierno (ver Inteligencia artificial en el gobierno )
Complementar y/o reemplazar a los especialistas humanos en servicio al cliente ^[31] en dominios como atención médica, ventas y banca. Un informe estimó que un asistente en línea automatizado produjo una disminución del 30% en la carga de trabajo de un centro de llamadas proporcionado por humanos . ^[32]
Mejore la experiencia de conducción permitiendo la interacción con asistentes virtuales como Siri y Alexa mientras está en el automóvil.

Comercio conversacional

El comercio conversacional es el comercio electrónico a través de diversos medios de mensajería, incluidos asistentes de voz ^[33], pero también chat en vivo en sitios web de comercio electrónico , chat en vivo en aplicaciones de mensajería como WeChat , Facebook Messenger y WhatsApp ^[34] y chatbots en mensajería. aplicaciones o sitios web.

Atención al cliente

Un asistente virtual puede trabajar con el equipo de atención al cliente de una empresa para brindar soporte a los clientes las 24 horas del día, los 7 días de la semana. Proporciona respuestas rápidas, lo que mejora la experiencia del cliente.

Servicios de terceros

Amazon habilita las "Habilidades" de Alexa y las "Acciones" de Google, esencialmente aplicaciones que se ejecutan en las plataformas del asistente.

Privacidad

Los asistentes virtuales tienen una variedad de preocupaciones de privacidad asociadas a ellos. Funciones como la activación por voz representan una amenaza, ya que dichas funciones requieren que el dispositivo esté siempre escuchando. ^[35] Se han propuesto modos de privacidad como el botón de seguridad virtual para crear una autenticación multicapa para asistentes virtuales. ^[36]

Asistente de Google

La política de privacidad del Asistente de Google establece que no almacena los datos de audio sin el permiso del usuario, pero puede almacenar las transcripciones de la conversación para personalizar su experiencia. La personalización se puede desactivar en la configuración. Si un usuario quiere que el Asistente de Google almacene datos de audio, puede ir a Actividad de voz y audio (VAA) y activar esta función. Los archivos de audio se envían a la nube y Google los utiliza para mejorar el rendimiento del Asistente de Google, pero solo si la función VAA está activada. ^[37]

alexa amazona

La política de privacidad del asistente virtual de Amazon, Alexa, establece que sólo escucha las conversaciones cuando se utiliza su palabra de activación (como Alexa, Amazon, Echo). Comienza a grabar la conversación después de la llamada de una palabra de activación y deja de grabar después de 8 segundos de silencio. Envía la conversación grabada a la nube. Es posible eliminar la grabación de la nube visitando 'Privacidad de Alexa' en 'Alexa'. ^[38]

Siri de Apple

Apple afirma que no graba audio para mejorar Siri. En cambio, afirma utilizar transcripciones. Los datos de la transcripción solo se envían si se consideran importantes para el análisis. Los usuarios pueden optar por no participar en cualquier momento si no quieren que Siri envíe las transcripciones a la nube. ^[39]

Interés del consumidor

Se presume valor agregado al permitir una nueva forma de interacciones.

El valor añadido de los asistentes virtuales puede provenir, entre otros, de lo siguiente:

En ocasiones, la comunicación por voz puede representar la comunicación óptima hombre-máquina :

Es conveniente: hay sectores en los que la voz es la única vía de comunicación posible y, en general, permite liberar ambas manos y la visión para potencialmente realizar otra actividad en paralelo, o ayudar también a las personas discapacitadas.
Es más rápido: La voz es más eficaz que escribir en un teclado: podemos hablar hasta 200 palabras por minuto frente a las 60 en caso de escribir en un teclado. También es más natural y requiere menos esfuerzo (leer un texto puede alcanzar sin embargo 700 palabras por minuto). ^[40]

Los asistentes virtuales ahorran mucho tiempo gracias a la automatización: pueden concertar citas o leer las noticias mientras el consumidor hace otra cosa. También es posible pedirle al asistente virtual que programe reuniones, ayudando así a organizar el tiempo. Los diseñadores de las nuevas agendas digitales explicaron la ambición que tenían de que estos calendarios programaran vidas para hacer que el consumidor utilice su tiempo de forma más eficiente, a través de procesos de aprendizaje automático, y una completa organización del tiempo de trabajo y tiempo libre. A modo de ejemplo cuando el consumidor expresa el deseo de programar un descanso, el VA lo programará en un momento óptimo para ello (por ejemplo en un momento de la semana donde sea menos productivo), con el objetivo adicional a largo plazo de pudiendo programar y organizar el tiempo libre del consumidor, para asegurarle una óptima eficiencia en el trabajo. ^[41]

Interés percibido

Según un estudio reciente (2019), las dos razones para que los consumidores utilicen asistentes virtuales son la utilidad percibida y el disfrute percibido. El primer resultado de este estudio es que tanto la utilidad percibida como el disfrute percibido tienen una influencia muy fuerte equivalente en la disposición del consumidor a utilizar un asistente virtual.
El segundo resultado de este estudio es que:

La calidad del contenido proporcionado tiene una influencia muy fuerte en la utilidad percibida y una fuerte influencia en el disfrute percibido.
El atractivo visual tiene una influencia muy fuerte en el disfrute percibido.
La automatización tiene una fuerte influencia en la utilidad percibida. ^[42]

Controversias

Controversias sobre inteligencia artificial

Los asistentes virtuales estimulan la burbuja de filtros : En cuanto a las redes sociales , los algoritmos de los asistentes virtuales están entrenados para mostrar datos pertinentes y descartar otros en función de actividades previas del consumidor: los datos pertinentes son los que interesarán o agradarán al consumidor. Como resultado, quedan aislados de los datos que no están de acuerdo con sus puntos de vista, aislándolos efectivamente en su propia burbuja intelectual y reforzando sus opiniones. Se sabía que este fenómeno refuerza las noticias falsas y las cámaras de eco. ^[43]
A los asistentes virtuales también se les critica a veces por estar sobrevalorados. En particular, A. Casilli señala que las IA de los asistentes virtuales no son ni inteligentes ni artificiales por dos motivos:

No inteligentes porque lo único que hacen es ser asistente del humano, y sólo realizando tareas que un humano podría realizar fácilmente, y en un espectro de acciones muy limitado: buscar, clasificar y presentar información, ofertas o documentos. Además, los asistentes virtuales no son capaces de tomar decisiones por sí solos ni de anticiparse a las cosas.
Y no artificiales porque serían imposibles sin la etiquetación humana mediante el microtrabajo . ^[44]

Implicaciones éticas

En 2019, Antonio A. Casilli , sociólogo francés , criticó en particular la inteligencia artificial y los asistentes virtuales de la siguiente manera:

En un primer nivel, el hecho de que el consumidor proporcione gratuitamente datos para la formación y mejora del asistente virtual, muchas veces sin saberlo, es éticamente perturbador.

Pero en un segundo nivel, podría ser aún más inquietante desde el punto de vista ético saber cómo se entrenan estas IA con estos datos.

Esta inteligencia artificial se entrena mediante redes neuronales , que requieren una enorme cantidad de datos etiquetados. Sin embargo, estos datos necesitan ser etiquetados a través de un proceso humano, lo que explica el auge del microtrabajo en la última década. Es decir, utilizar de forma remota a algunas personas en todo el mundo para realizar algunas tareas repetitivas y muy simples por unos pocos centavos, como escuchar los datos de voz del asistente virtual y escribir lo que se dijo. El microtrabajo ha sido criticado por la inseguridad laboral que provoca y por la falta total de regulación: el salario medio era de 1,38 dólares por hora en 2010, ^[45] y no proporciona asistencia sanitaria ni prestaciones de jubilación, ni subsidio de enfermedad ni salario mínimo . Por lo tanto, los asistentes virtuales y sus diseñadores son controvertidos por estimular la inseguridad laboral, y las IA que proponen siguen siendo humanas en la forma en que serían imposibles sin el microtrabajo de millones de trabajadores humanos. ^[44]

Las preocupaciones sobre la privacidad surgen por el hecho de que los comandos de voz están disponibles para los proveedores de asistentes virtuales en forma no cifrada y, por lo tanto, pueden compartirse con terceros y procesarse de manera no autorizada o inesperada. ^[46] Además del contenido lingüístico del discurso grabado, la forma de expresión y las características de la voz de un usuario pueden contener implícitamente información sobre su identidad biométrica, rasgos de personalidad, forma corporal, condición de salud física y mental, sexo, género, estados de ánimo y emociones. , nivel socioeconómico y origen geográfico. ^[47]

Plataformas de desarrollador

Las plataformas de desarrollo notables para asistentes virtuales incluyen:

Amazon Lex se abrió a los desarrolladores en abril de 2017. Implica tecnología de comprensión del lenguaje natural combinada con reconocimiento automático de voz y se introdujo en noviembre de 2016. ^[48]
Google proporciona las plataformas Acciones en Google y Dialogflow para que los desarrolladores creen "Acciones" para el Asistente de Google ^[49]
Apple proporciona SiriKit para que los desarrolladores creen extensiones para Siri
Watson de IBM , aunque a veces se habla de asistente virtual, es en realidad una plataforma y una comunidad de inteligencia artificial completa que impulsa algunos asistentes virtuales, los chatbots . y muchos otros tipos de soluciones. ^[50]^[51]

Generaciones previas

En generaciones anteriores de asistentes virtuales basados en chat de texto, el asistente a menudo estaba representado por un avatar (también conocido como personaje interactivo en línea o personaje automatizado ); esto se conocía como agente encarnado .

Relevancia económica

Para individuos

Las experiencias digitales habilitadas por asistentes virtuales se consideran uno de los principales avances tecnológicos recientes y las tendencias de consumo más prometedoras. Los expertos afirman que las experiencias digitales alcanzarán un estatus comparable al de las experiencias "reales", si no se vuelven más buscadas y apreciadas. ^[52] La tendencia se verifica por un elevado número de usuarios frecuentes y el crecimiento sustancial del número de usuarios de asistentes digitales virtuales en todo el mundo. A mediados de 2017, se estima que el número de usuarios frecuentes de asistentes virtuales digitales ronda los mil millones en todo el mundo. ^[53] Además, se puede observar que la tecnología de asistente digital virtual ya no se limita a las aplicaciones de teléfonos inteligentes, sino que está presente en muchos sectores industriales (incluidos el automóvil , las telecomunicaciones, el comercio minorista , la atención sanitaria y la educación). ^[54] En respuesta a los importantes gastos en I+D de las empresas de todos los sectores y a la creciente implementación de dispositivos móviles, se prevé que el mercado de la tecnología de reconocimiento de voz crecerá a una tasa compuesta anual del 34,9% a nivel mundial durante el período de 2016 a 2024 y, por lo tanto, superará un tamaño de mercado global de 7.500 millones de dólares estadounidenses para 2024. ^[54] Según un estudio de Ovum , se prevé que la "base instalada de asistentes digitales nativos" supere la población mundial para 2021, con 7.500 millones de dispositivos con capacidad de IA de voz activa. ^[55] Según Ovum, para entonces "el Asistente de Google dominará el mercado de dispositivos con capacidad de inteligencia artificial de voz con una participación de mercado del 23,3%, seguido por Bixby de Samsung (14,5%), Siri de Apple (13,1%), Alexa de Amazon (3,9%) y Cortana de Microsoft (2,3%)". ^[55]

Teniendo en cuenta la distribución regional de los líderes del mercado, se espera que las empresas norteamericanas (por ejemplo, Nuance Communications , IBM , eGain ) dominen la industria en los próximos años, debido al impacto significativo de BYOD ( Traiga su propio dispositivo ) y el negocio de movilidad empresarial. modelos. Además, se espera que la creciente demanda de plataformas asistidas por teléfonos inteligentes impulse aún más el crecimiento de la industria de asistentes virtuales inteligentes (IVA) en América del Norte. A pesar de su tamaño más pequeño en comparación con el mercado norteamericano, se prevé que la industria de asistentes virtuales inteligentes de la región de Asia y el Pacífico , con sus principales actores ubicados en India y China, crezca a una tasa de crecimiento anual del 40% (por encima del promedio mundial). durante el período 2016-2024. ^[54]

Oportunidad económica para las empresas

Los asistentes virtuales no deberían verse sólo como un gadget para particulares, sino que podrían tener una utilidad económica real para las empresas. Por ejemplo, un asistente virtual puede asumir el papel de un asistente siempre disponible con conocimientos enciclopédicos. Y que puede organizar reuniones, consultar inventarios, verificar informaciones. Los asistentes virtuales son tanto más importantes cuanto que su integración en las pequeñas y medianas empresas a menudo consiste en un sencillo primer paso a través de una adaptación y un uso más global del Internet de las cosas (IoT) . De hecho, las pequeñas y medianas empresas perciben primero las tecnologías de IoT como tecnologías de importancia crítica, pero demasiado complicadas, arriesgadas o costosas para utilizarlas. ^[56]

Seguridad

En mayo de 2018, investigadores de la Universidad de California, Berkeley , publicaron un artículo que mostraba que comandos de audio indetectables para el oído humano podrían integrarse directamente en música o texto hablado, manipulando así a los asistentes virtuales para que realicen ciertas acciones sin que el usuario se dé cuenta. . ^[57] Los investigadores realizaron pequeños cambios en los archivos de audio, que cancelaron los patrones de sonido que los sistemas de reconocimiento de voz deben detectar. Estos fueron reemplazados por sonidos que el sistema interpretaría de manera diferente y le ordenarían marcar números de teléfono, abrir sitios web o incluso transferir dinero. ^[57] La posibilidad de que esto ocurra se conoce desde 2016, ^[57] y afecta a dispositivos de Apple, Amazon y Google. ^[58]

Además de las acciones no intencionadas y las grabaciones de voz, otro riesgo de seguridad y privacidad asociado con los asistentes virtuales inteligentes son los comandos de voz maliciosos: un atacante que se hace pasar por un usuario y emite comandos de voz maliciosos para, por ejemplo, desbloquear una puerta inteligente para obtener acceso no autorizado a una casa o garaje o pedir artículos en línea sin el conocimiento del usuario. Aunque algunos IVA ofrecen una función de entrenamiento de voz para evitar dicha suplantación, puede resultar difícil para el sistema distinguir entre voces similares. Por lo tanto, una persona malintencionada que pueda acceder a un dispositivo habilitado para IVA podría engañar al sistema haciéndole creer que es el verdadero propietario y llevar a cabo actos delictivos o traviesos. ^[59]

Comparación de asistentes notables

Ver también

Referencias

^ Hoy, Matthew B. (2018). "Alexa, Siri, Cortana y más: introducción a los asistentes de voz". Servicios de referencia médica trimestral . 37 (1): 81–88. doi :10.1080/02763869.2018.1404391. PMID 29327988. S2CID 30809087.
^ "Siri, Alexa, Google Assistant y Bixby: ¿cuál reina de forma suprema?". Autoridad de Android . 29 de enero de 2024.
^ "La magia de los asistentes virtuales y su impacto en la atención al cliente".
^ ab "Lo único para lo que definitivamente deberías usar AI Chatbot". 7 de abril de 2023.
^ "IA significa que todo el mundo tiene un asistente personal de 'cuello blanco', dice Bill Gates".
^ "Chat GPT: ¿Qué es?". uca.edu . Consultado el 8 de febrero de 2024 .
^ US 1209636, Christian Berger, "Controlador de circuito operado por sonido", emitido el 19 de diciembre de 1916, asignado a Submarine Wireless Company
^ Markowitz, Judith. "Juguetes que tienen voz". SpeechTechMag .
^ Moskvitch, Katia. "Las máquinas que aprendieron a escuchar". BBC . Consultado el 5 de mayo de 2020 .
^ Epstein, J; Klinkenberg, WD (1 de mayo de 2001). "De Eliza a Internet: una breve historia de la evaluación informática". Las computadoras en el comportamiento humano . 17 (3): 295–314. doi :10.1016/S0747-5632(01)00004-8. ISSN 0747-5632.
^ Weizenbaum, José (1976). Poder informático y razón humana: del juicio al cálculo. Biblioteca Oliver Wendell Holmes Academia Phillips. San Francisco: WH Freeman.
^ https://www.youtube.com/watch?v=Ra9ov-ud_Q0
^ "Smartphone: su nuevo asistente personal - Orange Pop". 10 de julio de 2017. Archivado desde el original el 10 de julio de 2017 . Consultado el 5 de mayo de 2020 .
^ Murph, Darren (4 de octubre de 2011). "¡Práctica del iPhone 4S!". Engadget.com . Consultado el 10 de diciembre de 2017 .
^ "Reportaje: Von IBM Shoebox bis Siri: 50 Jahre Spracherkennung - WELT" [De IBM Shoebox a Siri: 50 años de reconocimiento de voz]. Die Welt (en alemán). Welt.de. 20 de abril de 2012 . Consultado el 10 de diciembre de 2017 .
^ Kundu, Kishalaya (2023). "Amazon amplía la línea Echo con nuevos altavoces inteligentes, auriculares y más". XDA . Consultado el 26 de mayo de 2023 .
^ Sterling, Bruce (13 de febrero de 2020). "Semántica web: Microsoft Project Turing presenta la generación de lenguaje natural de Turing (T-NLG)". Cableado . ISSN 1059-1028 . Consultado el 31 de julio de 2020 .
^ "GPT-4 arrasa en el mundo: lista de empresas que integraron el chatbot". 21 de marzo de 2023.
^ "Conversica recauda 31 millones de dólares en financiación Serie C para impulsar la expansión de la IA conversacional para empresas". Bloomberg.com . 30 de octubre de 2018 . Consultado el 23 de octubre de 2020 .
^ Herrera, Sebastián (26 de septiembre de 2019). "Amazon amplía el alcance de Alexa a los dispositivos portátiles". El periodico de Wall Street . Consultado el 26 de septiembre de 2019 .
^ "S7617: desarrollo de su propio motor Wake Word como 'Alexa' y 'OK Google'". Conferencia sobre tecnología GPU . Consultado el 17 de julio de 2017 .
^ Van Loo, Rory (1 de marzo de 2019). "Perfección del mercado digital". Revisión de la ley de Michigan . 117 (5): 815. doi : 10.36644/mlr.117.5.digital . S2CID 86402702.
^ La, Lynn (27 de febrero de 2017). "Todo lo que el Asistente de Google puede hacer en el Pixel". CNET . Consultado el 10 de diciembre de 2017 .
^ Morrison, Maureen (5 de octubre de 2014). "Domino's lanza la aplicación de pedidos por voz en la comida rápida primero | Estrategia CMO". Edad publicitaria . Consultado el 10 de diciembre de 2017 .
^ O'Shea, Dan (4 de enero de 2017). "LG presenta un refrigerador inteligente con pedidos de comestibles habilitados por Amazon Alexa". Buceo al por menor . Consultado el 10 de diciembre de 2017 .
^ Gibbs, Samuel (7 de febrero de 2017). "Alexa de Amazon escapa del Echo y se sube a los coches | Tecnología". El guardián . Consultado el 10 de diciembre de 2017 .
^ "¿Qué es el Asistente de Google, cómo funciona y qué dispositivos lo ofrecen?". Pelusa de bolsillo. 6 de octubre de 2017 . Consultado el 10 de diciembre de 2017 .
^ "'Pregúntale a Jenn, sitio web de Alaska Airlines ". Aerolíneas de Alaska. 2 de enero de 2017 . Consultado el 10 de diciembre de 2017 .
^ Canal tecnológico de AT&T (26 de junio de 2013). "American Airlines (US Airways): primera aerolínea de EE. UU. en implementar el habla en lenguaje natural" (vídeo), Nuance Enterprise en YouTube. Archivado desde el original el 21 de diciembre de 2021 . Consultado el 10 de diciembre de 2017 a través de YouTube. Título de YouTube: Sistema de información de aerolíneas, 1989 – Archivos de AT&T – reconocimiento de voz
^ Martín, Taylor; Sacerdote, David (10 de septiembre de 2017). "La lista completa de comandos de Alexa hasta el momento". CNET . Consultado el 10 de diciembre de 2017 .
^ Kongthon, Alisa; Sangkeettrakarn, Chatchawal; Kongyoung, Sarawoot; Haruechaiyasak, Choochart (1 de enero de 2009). "Implementación de un sistema de mesa de ayuda online basado en agente conversacional". Actas de la Conferencia Internacional sobre Gestión de Ecosistemas Digitales Emergentes . MEDIOS '09. Nueva York, NY, Estados Unidos: ACM. págs. 69:450–69:451. doi :10.1145/1643823.1643908. ISBN 9781605588292. S2CID 1046438.
^ O'Donnell, Anthony (3 de junio de 2010). "El nuevo" asistente virtual en línea de Aetna"". Seguros y tecnología. Archivado desde el original el 7 de junio de 2010.
^ "Cómo preparar sus productos y su marca para el comercio conversacional". 6 de marzo de 2018.
^ Taylor, Glenn (5 de marzo de 2018). "La gran oportunidad del comercio minorista: el 87% de los consumidores estadounidenses captan el poder del comercio conversacional: puntos de contacto minoristas".
^ Zhang, Guoming; Yan, Chen; Ji, Xiaoyu; Zhang, Tianchen; Zhang, Taimin; Xu, Wenyuan (2017). "Ataque de delfines". Actas de la Conferencia ACM SIGSAC de 2017 sobre seguridad informática y de las comunicaciones - CCS '17 . págs. 103-117. arXiv : 1708.09537 . doi :10.1145/3133956.3134052. ISBN 9781450349468. S2CID 2419970.
^ Lei, Xinyu; Tu, Guan-Hua; Liu, Alex X.; Li, Chi-Yu; Xie, Tian (2017). "La inseguridad de los asistentes de voz digitales domésticos: Amazon Alexa como estudio de caso". arXiv : 1712.03327 [cs.CR].
^ "Hacer más para proteger su privacidad con el Asistente". Google . 23 de septiembre de 2019 . Consultado el 27 de febrero de 2020 .
^ "Alexa, dispositivos Echo y su privacidad". Amazon.com . Consultado el 27 de febrero de 2020 .
^ "Mejorar la protección de la privacidad de Siri". Sala de prensa de Apple . Consultado el 27 de febrero de 2020 .
^ Minker, W.; Neel, F. (2002). "Desarrollo de tecnologías vocales". El trabajo humano . 65 (3): 261. doi : 10.3917/th.653.0261 . ISSN 0041-1868.
^ Wajcman, Judy (2019). «La Arquitectura Digital de la Gestión del Tiempo» (PDF) . Ciencia, tecnología y valores humanos . 44 (2): 315–337. doi :10.1177/0162243918795041. S2CID 149648777.
^ Yang, Heetae; Lee, Hwansoo (26 de junio de 2018). "Comprensión del comportamiento del usuario de los dispositivos de asistente personal virtual". Sistemas de Información y Gestión de Negocios Electrónicos . 17 (1): 65–87. doi :10.1007/s10257-018-0375-1. ISSN 1617-9846. S2CID 56838915.
^ Tisseron, Serge (2019). "La familia sous écoute". L'École des Parents . n° 632 (3): 16-18. doi :10.3917/epar.632.0016. ISSN 0424-2238. S2CID 199344092. {{cite journal}}: |volume=tiene texto extra ( ayuda )
^ ab Casilli, Antonio A. (2019). En asistente de los robots. Enquête sur le travail du clic . Ediciones Seuil. ISBN 978-2-02-140188-2. OCLC 1083583353.
^ Horton, John José; Chilton, Lydia B. (2010). "La economía laboral del crowdsourcing remunerado". Actas de la 11ª conferencia ACM sobre comercio electrónico . CE '10. Nueva York, Nueva York, Estados Unidos: ACM Press. págs. 209-218. arXiv : 1001.0627 . doi :10.1145/1807342.1807376. ISBN 978-1-60558-822-3. S2CID 18237602.
^ "Apple, Google y Amazon pueden haber violado su privacidad al revisar los comandos del asistente digital". Fortuna . 5 de agosto de 2019 . Consultado el 13 de mayo de 2020 .
^ Kröger, Jacob León; Lutz, Otto Hans-Martin; Raschke, Philip (2020). "Implicaciones para la privacidad del análisis de voz y habla: divulgación de información por inferencia". Gestión de privacidad e identidad. Datos para una vida mejor: IA y privacidad . Avances del IFIP en tecnologías de la información y las comunicaciones. vol. 576, págs. 242-258. doi : 10.1007/978-3-030-42504-3_16 . ISBN 978-3-030-42503-6. ISSN 1868-4238.
^ "Amazon Lex, la tecnología detrás de Alexa, se abre a los desarrolladores". TecnologíaCrunch. 20 de abril de 2017 . Consultado el 10 de diciembre de 2017 .
^ "Acciones en Google | Desarrolladores de Google" . Consultado el 10 de diciembre de 2017 .
^ "Watson: historias de cómo la IA y Watson están transformando los negocios y nuestro mundo". IBM.com . Consultado el 10 de diciembre de 2017 .
^ Memeti, Suejb; Pllana, Sabri (enero 2018). "PAPA: un asistente de programación paralela impulsado por la tecnología de computación cognitiva IBM Watson". Revista de ciencia computacional . 26 : 275–284. doi :10.1016/j.jocs.2018.01.001.
^ "Cinco tendencias de consumo para 2017". Observación de tendencias. 31 de octubre de 2016 . Consultado el 10 de diciembre de 2017 .
^ Richter, Felix (26 de agosto de 2016). "Gráfico: Asistentes digitales: siempre a su servicio". Estatista . Consultado el 10 de diciembre de 2017 .
^ abc "Estadísticas de la industria de asistentes virtuales". Perspectivas del mercado global. 30 de enero de 2017 . Consultado el 10 de diciembre de 2017 .
^ ab "Los asistentes digitales virtuales superarán a la población mundial en 2021". ovum.informa.com . Consultado el 11 de mayo de 2018 .
^ Jones, Nory B.; Graham, C. Matt (febrero de 2018). "¿Puede el IoT ayudar a las pequeñas empresas?". Boletín de ciencia, tecnología y sociedad . 38 (1–2): 3–12. doi :10.1177/0270467620902365. ISSN 0270-4676. S2CID 214031256.
^ abc "Alexa y Siri pueden escuchar este comando oculto. Tú no". Los New York Times . 10 de mayo de 2018. ISSN 0362-4331 . Consultado el 11 de mayo de 2018 .
^ "A medida que los asistentes de voz se generalizan, los investigadores advierten sobre vulnerabilidades". CNET . 10 de mayo de 2018 . Consultado el 11 de mayo de 2018 .
^ Chung, H.; Iorga, M.; Voas, J.; Lee, S. (2017). "Alexa, ¿puedo confiar en ti?". Computadora . 50 (9): 100–104. doi :10.1109/MC.2017.3571053. ISSN 0018-9162. PMC 5714311 . PMID 29213147.
^ "Baidu presenta 3 altavoces inteligentes con su asistente digital Duer". 8 de enero de 2018.
^ MSV, Janakiram (20 de agosto de 2015). "Conozca Mycroft, la alternativa de código abierto a Amazon Echo". Forbes . Consultado el 27 de octubre de 2016 .