stringtranslate.com

Kismet (robot)

Kismet ahora reside en el Museo del MIT .

Kismet es una cabeza de robot que fue creada en los años 90 en el Instituto Tecnológico de Massachusetts ( MIT ) por la Dra. Cynthia Breazeal como un experimento en computación afectiva ; una máquina que puede reconocer y simular emociones . El nombre Kismet proviene de una palabra turca que significa "destino" o, a veces, "suerte". [1]

Diseño y construcción de hardware

Para que Kismet pueda interactuar adecuadamente con los seres humanos, contiene dispositivos de entrada que le otorgan capacidades auditivas , visuales y propioceptivas . Kismet simula emociones a través de diversas expresiones faciales, vocalizaciones y movimientos. Las expresiones faciales se crean mediante movimientos de las orejas, las cejas, los párpados, los labios, la mandíbula y la cabeza. El costo de los materiales físicos fue de aproximadamente US$25.000. [1]

Además del equipo mencionado anteriormente, hay cuatro Motorola 68332 , nueve PC de 400 MHz y otro PC de 500 MHz. [1]

Sistema de software

El sistema de software de inteligencia social de Kismet, o sistema nervioso sintético (SNS), fue diseñado teniendo en mente modelos humanos de comportamiento inteligente. Contiene seis subsistemas [2], como se detalla a continuación.

Sistema de extracción de características de bajo nivel

Este sistema procesa información visual y auditiva sin procesar de cámaras y micrófonos. El sistema de visión de Kismet puede detectar ojos, movimiento y, aunque es controvertido, el color de la piel. Cada vez que Kismet mueve la cabeza, desactiva momentáneamente su sistema de detección de movimiento para evitar detectar su propio movimiento. También utiliza sus cámaras estereoscópicas para estimar la distancia de un objeto en su campo visual, por ejemplo para detectar amenazas: objetos grandes, cercanos y con mucho movimiento. [3]

El sistema de audio de Kismet está orientado principalmente a identificar el afecto en el habla dirigida a los bebés . En particular, puede detectar cinco tipos diferentes de habla afectiva: aprobación, prohibición, atención, consuelo y neutral. El clasificador de intención afectiva se creó de la siguiente manera. Se extrajeron características de bajo nivel como la media del tono y la varianza de la energía (volumen) de muestras de habla grabada. Luego, las clases de intención afectiva se modelaron como un modelo de mezcla gaussiana y se entrenaron con estas muestras utilizando el algoritmo de maximización de expectativas . La clasificación se realiza en varias etapas, primero clasificando un enunciado en uno de dos grupos generales (por ejemplo, tranquilizador/neutral frente a prohibición/atención/aprobación) y luego haciendo una clasificación más detallada. Esta arquitectura mejoró significativamente el rendimiento para clases difíciles de distinguir, como aprobación ("Eres un robot inteligente") frente a atención ("Oye, Kismet, ven aquí"). [3]

Sistema de motivación

La Dra. Breazeal describe su relación con el robot como "algo así como una interacción entre un bebé y su cuidador, donde yo soy básicamente el cuidador y el robot es como un bebé". La descripción general establece la relación entre el humano y el robot dentro de un marco de aprendizaje, con la Dra. Breazeal proporcionando el andamiaje para el desarrollo de Kismet. Ofrece una demostración de las capacidades de Kismet, narradas como expresiones faciales emotivas que comunican el "estado motivacional" del robot. La Dra. Breazeal: "Este es enojo (risas), enojo extremo, disgusto, emoción, miedo, este es felicidad, este es interés, este es tristeza, sorpresa, este está cansado y este es sueño". [4]

En cualquier momento, Kismet solo puede estar en un estado emocional a la vez. Sin embargo, Breazeal afirma que Kismet no es consciente, por lo que no tiene sentimientos. [5]

Sistema motor

Kismet habla un protolenguaje con una variedad de fonemas, similar al balbuceo de un bebé. Utiliza el sintetizador de voz DECtalk y cambia el tono, el ritmo, la articulación, etc. para expresar diversas emociones. La entonación se utiliza para variar entre expresiones interrogativas y afirmativas. La sincronización de labios era importante para el realismo, y los desarrolladores utilizaron una estrategia de animación: [6] "la simplicidad es el secreto de una animación de labios exitosa". Por lo tanto, no intentaron imitar los movimientos de los labios a la perfección, sino "crear una taquigrafía visual que pase inadvertida para el espectador".

Véase también

Referencias

  1. ^ abc Peter Menzel y Faith D'Aluisio. Robosapiens . Cambridge: The MIT Press, 2000. Pág. 66
  2. ^ Breazeal, Cynthia. Diseño de robots sociables . The MIT Press, 2002
  3. ^ ab "Kismet, el robot".
  4. ^ Suchman, Lucy. "Objetos-sujetos". Teoría feminista. 2011, pág. 127
  5. ^ Breazeal, Cynthia. Diseño de robots sociables . The MIT Press, 2002, pág. 112
  6. ^ Madsen, R. Cine de animación: conceptos, métodos y usos . Interland, Nueva York, 1969

Enlaces externos