El reconocimiento de gestos ofrece un camino para que las computadoras comiencen a comprender e interpretar mejor el lenguaje del cuerpo humano , algo que antes no era posible a través de texto o interfaces gráficas de usuario (GUI) no mejoradas.
Los gestos pueden originarse a partir de cualquier movimiento o estado corporal, pero comúnmente se originan en la cara o la mano . Un área del campo es el reconocimiento de emociones derivadas de expresiones faciales y gestos con las manos. Los usuarios pueden realizar gestos sencillos para controlar o interactuar con los dispositivos sin tocarlos físicamente.
Se han realizado muchos enfoques utilizando cámaras y algoritmos de visión por computadora para interpretar el lenguaje de señas ; sin embargo, la identificación y el reconocimiento de la postura, la marcha, la proxémica y los comportamientos humanos también es objeto de técnicas de reconocimiento de gestos. [2]
Descripción general
El reconocimiento de gestos tiene aplicación en áreas tales como: [ ¿cuándo? ]
La literatura incluye trabajos en curso en el campo de la visión por computadora sobre la captura de gestos o posturas y movimientos humanos más generales mediante cámaras conectadas a una computadora. [6] [7] [8] [9]
El término "reconocimiento de gestos" se ha utilizado para referirse de manera más específica a símbolos de escritura a mano que no son de entrada de texto, como escribir con tinta en una tableta gráfica , gestos multitáctiles y reconocimiento de gestos del mouse . Se trata de una interacción informática mediante el dibujo de símbolos con un cursor de dispositivo señalador. [10] [11] [12] La computación con lápiz expande el reconocimiento de gestos digitales más allá de los dispositivos de entrada tradicionales, como teclados y ratones, y reduce el impacto del hardware de un sistema. [ ¿ cómo? ]
Tipos de gestos
En las interfaces de computadora, se distinguen dos tipos de gestos: [13] Consideramos gestos en línea, que también pueden considerarse manipulaciones directas como escalar y rotar y, por el contrario, los gestos fuera de línea generalmente se procesan una vez finalizada la interacción; por ejemplo, se dibuja un círculo para activar un menú contextual .
Gestos offline: Aquellos gestos que se procesan tras la interacción del usuario con el objeto. Un ejemplo es un gesto para activar un menú.
Gestos online: Gestos de manipulación directa. Se utilizan para escalar o rotar un objeto tangible.
Interfaz sin contacto
Una interfaz de usuario sin contacto (TUI) es un tipo emergente de tecnología en la que un dispositivo se controla mediante movimientos corporales y gestos sin tocar el teclado, el mouse o la pantalla. [14]
Tipos de tecnología sin contacto
Existen varios dispositivos que utilizan este tipo de interfaz, como teléfonos inteligentes, computadoras portátiles, juegos, televisores y equipos de música.
Un tipo de interfaz sin contacto utiliza la conectividad Bluetooth de un teléfono inteligente para activar el sistema de gestión de visitantes de una empresa. Esto elimina tener que tocar una interfaz, por conveniencia o para evitar una fuente potencial de contaminación como durante la pandemia de COVID-19 . [15]
Los dispositivos de entrada
La capacidad de rastrear los movimientos de una persona y determinar qué gestos puede estar realizando se puede lograr mediante varias herramientas. Las interfaces de usuario cinéticas (KUI) son un tipo emergente de interfaces de usuario que permiten a los usuarios interactuar con dispositivos informáticos a través del movimiento de objetos y cuerpos. [ cita necesaria ] Ejemplos de KUI incluyen interfaces de usuario tangibles y juegos sensibles al movimiento como Wii y Kinect de Microsoft , y otros proyectos interactivos. [dieciséis]
Aunque se ha realizado una gran cantidad de investigaciones sobre el reconocimiento de gestos basado en imágenes/vídeo, existen algunas variaciones en las herramientas y entornos utilizados entre las implementaciones.
Guantes con cable . Estos pueden proporcionar información a la computadora sobre la posición y rotación de las manos mediante dispositivos de seguimiento magnéticos o inerciales. Además, algunos guantes pueden detectar la flexión de los dedos con un alto grado de precisión (5-10 grados), o incluso proporcionar retroalimentación háptica al usuario, que es una simulación del sentido del tacto. El primer dispositivo tipo guante de seguimiento manual disponible comercialmente fue el DataGlove, [17] un dispositivo tipo guante que podía detectar la posición de la mano, el movimiento y la flexión de los dedos. Esto utiliza cables de fibra óptica que recorren el dorso de la mano. Se crean pulsos de luz y cuando se doblan los dedos, la luz se filtra a través de pequeñas grietas y se registra la pérdida, dando una aproximación a la postura de la mano.
Cámaras con reconocimiento de profundidad. Utilizando cámaras especializadas, como cámaras de luz estructurada o de tiempo de vuelo , se puede generar un mapa de profundidad de lo que se ve a través de la cámara a corta distancia y utilizar estos datos para aproximarse a una representación tridimensional de lo que se ve. Estos pueden ser eficaces para la detección de gestos con las manos debido a sus capacidades de corto alcance. [18]
Cámaras estéreo . Utilizando dos cámaras cuyas relaciones entre sí se conocen, se puede aproximar una representación 3D a partir de la salida de las cámaras. Para obtener las relaciones de las cámaras, se puede utilizar una referencia de posicionamiento, como una banda lexian o un emisor de infrarrojos . [19] En combinación con la medición directa del movimiento ( 6D-Vision ), se pueden detectar gestos directamente.
Controladores basados en gestos. Estos controladores actúan como una extensión del cuerpo, de modo que cuando se realizan gestos, el software puede capturar cómodamente parte de su movimiento. Un ejemplo de captura de movimiento emergente basada en gestos es el seguimiento de la mano esquelética , que se está desarrollando para aplicaciones de realidad virtual y realidad aumentada. Un ejemplo de esta tecnología lo muestran las empresas de seguimiento uSens y Gestigon , que permiten a los usuarios interactuar con su entorno sin controladores. [20] [21]
Seguimiento de gestos del mouse , donde el movimiento del mouse se correlaciona con un símbolo dibujado por la mano de una persona que puede estudiar cambios en la aceleración a lo largo del tiempo para representar gestos. [23] [24] [25] El software también compensa el temblor humano y el movimiento involuntario. [26] [27] [28] Los sensores de estos cubos emisores de luz inteligentes se pueden usar para detectar manos y dedos, así como otros objetos cercanos, y se pueden usar para procesar datos. La mayoría de las aplicaciones se encuentran en la música y la síntesis de sonido, [29] pero se pueden aplicar a otros campos.
Cámara única . Se puede utilizar una cámara 2D estándar para el reconocimiento de gestos cuando los recursos o el entorno no serían convenientes para otras formas de reconocimiento basado en imágenes. Anteriormente se pensaba que una sola cámara podría no ser tan eficaz como las cámaras estéreo o con detección de profundidad, pero algunas empresas están cuestionando esta teoría. Tecnología de reconocimiento de gestos basada en software que utiliza una cámara 2D estándar que puede detectar gestos fuertes con las manos.
Algoritmos
Dependiendo del tipo de datos de entrada, el enfoque para interpretar un gesto podría realizarse de diferentes maneras. Sin embargo, la mayoría de las técnicas se basan en punteros clave representados en un sistema de coordenadas 3D. A partir del movimiento relativo de estos, se puede detectar el gesto con gran precisión, dependiendo de la calidad de la entrada y del enfoque del algoritmo. [30]
Para interpretar los movimientos del cuerpo, hay que clasificarlos según sus propiedades comunes y el mensaje que pueden expresar. Por ejemplo, en la lengua de signos, cada gesto representa una palabra o frase.
Alguna literatura diferencia dos enfoques diferentes en el reconocimiento de gestos: uno basado en modelos 3D y otro basado en apariencia. [31] El método principal utiliza información 3D sobre elementos clave de las partes del cuerpo para obtener varios parámetros importantes, como la posición de la palma o los ángulos de las articulaciones. Los enfoques derivados de él, como los modelos volumétricos, han demostrado ser muy intensivos en términos de potencia computacional y requieren mayores desarrollos tecnológicos para poder implementarlos en el análisis en tiempo real. Alternativamente, los sistemas basados en la apariencia utilizan imágenes o vídeos para la interpretación directa. Estos modelos son más fáciles de procesar, pero normalmente carecen de la generalidad necesaria para la interacción persona-computadora.
Algoritmos basados en modelos 3D
El enfoque del modelo 3D puede utilizar modelos volumétricos o esqueléticos o incluso una combinación de ambos. Los enfoques volumétricos se han utilizado mucho en la industria de la animación por computadora y con fines de visión por computadora. Los modelos generalmente se crean a partir de superficies 3D complicadas, como NURBS o mallas poligonales.
El inconveniente de este método es que requiere mucha computación y aún están por desarrollarse sistemas para el análisis en tiempo real. Por el momento, un enfoque más interesante sería asignar objetos primitivos simples a las partes más importantes del cuerpo de la persona (por ejemplo, cilindros para los brazos y el cuello, esferas para la cabeza) y analizar la forma en que interactúan entre sí. Además, algunas estructuras abstractas como las supercuádricas y los cilindros generalizados pueden ser incluso más adecuadas para aproximar las partes del cuerpo.
Algoritmos basados en el esqueleto
En lugar de utilizar un procesamiento intensivo de los modelos 3D y tratar con muchos parámetros, se puede utilizar una versión simplificada de los parámetros de los ángulos de las articulaciones junto con las longitudes de los segmentos. Esto se conoce como representación esquelética del cuerpo, donde se calcula un esqueleto virtual de la persona y se asignan partes del cuerpo a ciertos segmentos. El análisis aquí se realiza utilizando la posición y orientación de estos segmentos y la relación entre cada uno de ellos (por ejemplo, el ángulo entre las juntas y la posición u orientación relativa)
Ventajas de utilizar modelos esqueléticos:
Los algoritmos son más rápidos porque sólo se analizan parámetros clave.
Es posible comparar patrones con una base de datos de plantilla
El uso de puntos clave permite que el programa de detección se centre en las partes importantes del cuerpo.
Modelos basados en la apariencia
Los modelos basados en la apariencia ya no utilizan una representación espacial del cuerpo, sino que derivan sus parámetros directamente de las imágenes o vídeos utilizando una base de datos de plantillas. Algunos se basan en plantillas 2D deformables de las partes del cuerpo humano, en particular las manos. Las plantillas deformables son conjuntos de puntos en el contorno de un objeto, utilizados como nodos de interpolación para la aproximación del contorno del objeto. Una de las funciones de interpolación más simples es la lineal, que realiza una forma promedio a partir de conjuntos de puntos, parámetros de variabilidad de puntos y deformación externa. Estos modelos basados en plantillas se utilizan principalmente para el seguimiento manual, pero también podrían utilizarse para la clasificación de gestos simples.
El segundo enfoque en la detección de gestos que utiliza modelos basados en la apariencia utiliza secuencias de imágenes como plantillas de gestos. Los parámetros de este método son las imágenes mismas o ciertas características derivadas de ellas. La mayoría de las veces, sólo se utilizan una vista (monoscópica) o dos (estereoscópicas).
Modelos basados en electromiografía
La electromiografía (EMG) se refiere al estudio de las señales eléctricas producidas por los músculos del cuerpo. Mediante la clasificación de los datos recibidos de los músculos del brazo, es posible clasificar la acción y así introducir el gesto en un software externo. [1] Los dispositivos EMG de consumo permiten enfoques no invasivos, como una banda para el brazo o la pierna, y se conectan a través de Bluetooth. Debido a esto, la EMG tiene una ventaja sobre los métodos visuales, ya que el usuario no necesita estar frente a una cámara para dar información, lo que permite una mayor libertad de movimiento.
Desafíos
Existen muchos desafíos asociados con la precisión y utilidad del reconocimiento de gestos y el software diseñado para implementarlo. Para el reconocimiento de gestos basado en imágenes, existen limitaciones en cuanto al equipo utilizado y al ruido de la imagen . Es posible que las imágenes o los videos no estén bajo una iluminación constante o en el mismo lugar. Los elementos en segundo plano o las características distintivas de los usuarios pueden dificultar el reconocimiento.
La variedad de implementaciones para el reconocimiento de gestos basado en imágenes también puede causar problemas con la viabilidad de la tecnología para uso general. Por ejemplo, es posible que un algoritmo calibrado para una cámara no funcione para otra cámara. La cantidad de ruido de fondo también provoca dificultades de seguimiento y reconocimiento, especialmente cuando se producen oclusiones (parciales y totales). Además, la distancia a la cámara y la resolución y calidad de la cámara también provocan variaciones en la precisión del reconocimiento.
Para capturar los gestos humanos mediante sensores visuales también se requieren métodos robustos de visión por computadora, por ejemplo para el seguimiento de las manos y el reconocimiento de la postura de las manos [32] [33] [34] [35] [ 36] [37] [38] [39] [40] o para capturar movimientos de la cabeza, expresiones faciales o dirección de la mirada.
Aceptabilidad social
Un desafío importante para la adopción de interfaces gestuales en dispositivos móviles de consumo, como teléfonos inteligentes y relojes inteligentes, surge de las implicaciones de aceptabilidad social de los gestos. Si bien los gestos pueden facilitar la entrada rápida y precisa en muchas computadoras con factores de forma novedosos, su adopción y utilidad a menudo están limitadas por factores sociales más que técnicos. Con este fin, los diseñadores de métodos de entrada de gestos pueden buscar equilibrar tanto las consideraciones técnicas como la voluntad del usuario de realizar gestos en diferentes contextos sociales. [41] Además, diferentes dispositivos de hardware y mecanismos de detección admiten diferentes tipos de gestos reconocibles.
Dispositivo móvil
Las interfaces de gestos en dispositivos móviles y de factor de forma pequeño suelen estar respaldadas por la presencia de sensores de movimiento, como unidades de medida inercial (IMU). En estos dispositivos, la detección de gestos depende de que los usuarios realicen gestos basados en el movimiento capaces de ser reconocidos por estos sensores de movimiento. Potencialmente, esto puede dificultar la captura de señales de gestos sutiles o de movimiento lento, ya que puede resultar difícil distinguirlos de los movimientos naturales o del ruido. A través de una encuesta y un estudio sobre la usabilidad de los gestos, los investigadores descubrieron que los gestos que incorporan movimientos sutiles, que parecen similares a la tecnología existente, se ven o se sienten similares a cada acción y son agradables, tenían más probabilidades de ser aceptados por los usuarios, mientras que los gestos que parecen extraños. , son incómodos de realizar, interfieren con la comunicación o implican movimientos poco comunes, lo que hace que los usuarios sean más propensos a rechazar su uso. [41] La aceptabilidad social de los gestos de los dispositivos móviles depende en gran medida de la naturalidad del gesto y del contexto social.
Computadoras corporales y portátiles
Las computadoras portátiles generalmente se diferencian de los dispositivos móviles tradicionales en que su ubicación de uso e interacción tiene lugar en el cuerpo del usuario. En estos contextos, las interfaces gestuales pueden resultar preferidas a los métodos de entrada tradicionales, ya que su pequeño tamaño hace que las pantallas táctiles o los teclados sean menos atractivos. Sin embargo, comparten muchos de los mismos obstáculos de aceptabilidad social que los dispositivos móviles cuando se trata de interacción gestual. Sin embargo, la posibilidad de que las computadoras portátiles queden ocultas a la vista o integradas en otros objetos cotidianos, como la ropa, permite que los gestos imiten interacciones comunes con la ropa, como ajustar el cuello de una camisa o frotarse el bolsillo delantero del pantalón. [42] [43] Una consideración importante para la interacción con computadoras portátiles es la ubicación para la colocación e interacción del dispositivo. Un estudio que explora las actitudes de terceros hacia la interacción con dispositivos portátiles realizado en Estados Unidos y Corea del Sur encontró diferencias en la percepción del uso de computadoras portátiles entre hombres y mujeres, en parte debido a diferentes áreas del cuerpo consideradas socialmente sensibles. [43] Otro estudio que investigó la aceptabilidad social de las interfaces proyectadas en el cuerpo encontró resultados similares; ambos estudios etiquetaron las áreas alrededor de la cintura, la ingle y la parte superior del cuerpo (para las mujeres) como las menos aceptables, mientras que las áreas alrededor del antebrazo y la muñeca son las menos aceptables. más aceptable. [44]
Instalaciones publicas
Las instalaciones públicas , como las pantallas públicas interactivas, permiten el acceso a información y muestran medios interactivos en entornos públicos como museos, galerías y teatros. [45] Si bien las pantallas táctiles son una forma frecuente de entrada para pantallas públicas, las interfaces de gestos brindan beneficios adicionales, como una mejor higiene, interacción a distancia y una mejor visibilidad, y pueden favorecer la interacción performativa. [42] Una consideración importante para la interacción gestual con exhibiciones públicas es la alta probabilidad o expectativa de una audiencia de espectadores. [45]
Fatiga
La fatiga del brazo fue un efecto secundario del uso de una pantalla táctil orientada verticalmente o de un lápiz óptico. En periodos de uso prolongado, los brazos de los usuarios comenzaron a sentirse fatigados y/o incómodos. Este efecto contribuyó al declive de la entrada de datos en la pantalla táctil a pesar de su popularidad inicial en la década de 1980. [46] [47]
Para medir el efecto secundario de la fatiga del brazo, los investigadores desarrollaron una técnica llamada Resistencia Consumida. [48] [49]
^ ab Kobylarz, Jhonatan; Pájaro, Jordania J.; Faria, Diego R.; Ribeiro, Eduardo Parente; Ekárt, Anikó (7 de marzo de 2020). "Pulgares arriba, pulgares abajo: interacción no verbal entre humanos y robots a través de clasificación EMG en tiempo real mediante aprendizaje por transferencia transductiva inductiva y supervisada" (PDF) . Revista de Inteligencia Ambiental y Computación Humanizada . Springer Science y Business Media LLC. 11 (12): 6021–6031. doi : 10.1007/s12652-020-01852-z . ISSN 1868-5137.
^ Matthias Rehm, Nikolaus Bee, Elisabeth André, Wave Like an Egypt: reconocimiento de gestos basado en acelerómetro para interacciones culturales específicas, British Computer Society, 2007
^ "Informe sobre el panorama de patentes Reconocimiento de gestos con las manos PatSeer Pro". PatSeer . Archivado desde el original el 2019-10-20 . Consultado el 2 de noviembre de 2017 .
^ Chai, Xiujuan y col. «Reconocimiento y traducción de lengua de signos con kinect Archivado el 10 de enero de 2021 en Wayback Machine .» Conferencia IEEE. sobre AFGR. vol. 655. 2013.
^ Sultana A, Rajapuspha T (2012), "Reconocimiento de gestos basado en la visión para gestos con las manos alfabéticos utilizando el clasificador SVM" [ enlace muerto permanente ] , Revista Internacional de Tecnología de Ingeniería y Ciencias de la Computación (IJCSET), 2012
^ Pavlovic, V., Sharma, R. y Huang, T. (1997), "Interpretación visual de los gestos con las manos para la interacción persona-computadora: una revisión", IEEE Transactions on Pattern Analysis and Machine Intelligence, julio de 1997. Vol. 1, núm. 19(7), págs. 677-695.
^ R. Cipolla y A. Pentland, Visión por computadora para la interacción hombre-máquina, Cambridge University Press, 1998, ISBN 978-0-521-62253-0
^ Ying Wu y Thomas S. Huang, "Reconocimiento de gestos basado en visión: una revisión" Archivado el 25 de agosto de 2011 en Wayback Machine , en: Comunicación basada en gestos en la interacción persona-computadora, volumen 1739 de Springer Lecture Notes in Computer Ciencia, páginas 103-115, 1999, ISBN 978-3-540-66935-7 , doi :10.1007/3-540-46616-9
^ Alejandro Jaimes y Nicu Sebe, Interacción multimodal persona-computadora: una encuesta Archivado el 6 de junio de 2011 en Wayback Machine , Computer Vision and Image Understanding Volumen 108, números 1-2, octubre-noviembre de 2007, páginas 116-134 Número especial sobre la visión para la interacción persona-computadora, doi :10.1016/j.cviu.2006.10.019
^ Dopertchouk, Oleg; "Reconocimiento de gestos de escritura a mano", gamedev.net , 9 de enero de 2004
^ Chen, Shijie; "Técnicas de reconocimiento de gestos en la aplicación de reconocimiento de escritura a mano", Fronteras en el reconocimiento de escritura a mano, páginas 142-147, noviembre de 2010
^ Balaji, R; Deepu, V; Madhvanath, Sriganesh; Prabhakaran, Jayasree "Reconocimiento de gestos escritos a mano para teclado de gestos" Archivado el 6 de septiembre de 2008 en Wayback Machine , Laboratorios Hewlett-Packard
^ Dietrich Kammer, Mandy Keck, Georg Freitag, Markus Wacker, Taxonomía y descripción general de marcos multitáctiles: arquitectura, alcance y características Archivado el 25 de enero de 2011 en Wayback Machine.
^ "Definición de interfaz de usuario sin contacto de la enciclopedia PC Magazine". pcmag.com . Consultado el 28 de julio de 2017 .
^ "La necesidad emergente de tecnologías de interacción sin contacto". Puerta de la investigación . Consultado el 30 de junio de 2021 .
^ S. Benford; H. Schnadelbach; B. Koleva; B. Gaver; A. Schmidt; A. Boucher; A. Corcel; R. Anastasi; C. Greenhalgh; T. Rodden; H.Gellersen (2003). "Sensato, sensato y deseable: un marco para diseñar interfaces físicas" (PDF) . CiteSeerX 10.1.1.190.2504 . Archivado desde el original (PDF) el 26 de enero de 2006.{{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Thomas G. Zimmerman, Jaron Lanier, Chuck Blanchard, Steve Bryson y Young Harvill. http://portal.acm.org. "UN DISPOSITIVO DE INTERFAZ DE GESTOS DE MANO". http://portal.acm.org.
^ Yang Liu, Yunde Jia, Un método robusto de reconocimiento de gestos y seguimiento de manos para interfaces visuales portátiles y sus aplicaciones, Actas de la Tercera Conferencia Internacional sobre Imágenes y Gráficos (ICIG'04), 2004
^ Kue-Bum Lee, Jung-Hyun Kim, Kwang-Seok Hong, Una implementación de una interfaz de juego multimodal basada en PDA, Quinta Conferencia Internacional sobre Investigación, Gestión y Aplicaciones de Ingeniería de Software, 2007
^ "Seguimiento de gestos de Gestigon: TechCrunch Disrupt". TechCrunch . Consultado el 11 de octubre de 2016 .
^ Matney, Lucas (29 de agosto de 2016). "uSens muestra nuevos sensores de seguimiento que tienen como objetivo ofrecer experiencias más ricas para la realidad virtual móvil". TechCrunch . Consultado el 29 de agosto de 2016 .
^ Jalili, Abdullah; Soliman, Abdel-Hamid; Asaduzzaman, Maryland; Griffiths, Alison (marzo de 2020). "Detección de Wi-Fi: aplicaciones y desafíos". La Revista de Ingeniería . 2020 (3): 87–97. arXiv : 1901.00715 . doi : 10.1049/joe.2019.0790 . ISSN 2051-3305.
^ Per Malmestig, Sofie Sundberg, SignWiiver: implementación de tecnología de lenguaje de señas Archivado el 25 de diciembre de 2008 en Wayback Machine.
^ Thomas Schlomer, Benjamin Poppinga, Niels Henze, Susanne Boll, Reconocimiento de gestos con un controlador Wii Archivado el 27 de julio de 2013 en Wayback Machine , Actas de la segunda conferencia internacional sobre interacción tangible e integrada, 2008
^ AiLive Inc., Informe técnico de LiveMove Archivado el 13 de julio de 2007 en Wayback Machine , 2006
^ Diseño electrónico 8 de septiembre de 2011. William Wong. La interfaz de usuario natural emplea integración de sensores.
^ Cable & Satellite International septiembre/octubre de 2011. Stephen Cousins. Una vista para una emoción. Archivado el 19 de enero de 2012 en Wayback Machine.
^ TechJournal South 7 de enero de 2008. Hillcrest Labs recauda una ronda de 25 millones de dólares.
^ Blog de Percussa AudioCubes 4 de octubre de 2012. Control gestual en síntesis de sonido. Archivado el 10 de septiembre de 2015 en Wayback Machine.
^ Mamtaz Alam; Dileep Kumar Tiwari (2016). "Reconocimiento de gestos y sus aplicaciones". doi :10.13140/RG.2.2.28139.54563.{{cite journal}}: Citar diario requiere |journal=( ayuda )
^ Vladimir I. Pavlovic, Rajeev Sharma, Thomas S. Huang, Interpretación visual de los gestos de las manos para la interacción persona-computadora; Una revisión, Transacciones IEEE sobre análisis de patrones e inteligencia artificial, 1997
^ Ivan Laptev y Tony Lindeberg "Seguimiento de modelos manuales de múltiples estados mediante filtrado de partículas y una jerarquía de características de imagen de múltiples escalas", Actas de espacio de escala y morfología en visión por computadora, volumen 2106 de Springer Lecture Notes in Computer Science, páginas 63 -74, Vancouver, BC, 1999. ISBN 978-3-540-42317-1 , doi :10.1007/3-540-47778-0
^ von Hardenberg, cristiano; Bérard, François (2001). "Interacción persona-computadora con las manos desnudas". Actas del taller de 2001 sobre interfaces de usuario perceptivas . Serie de actas de conferencias internacionales de ACM. vol. 15 archivo. Orlando Florida. págs. 1–8. CiteSeerX 10.1.1.23.4541 .
^ Lars Bretzner, Ivan Laptev, Tony Lindeberg "Reconocimiento de gestos manuales mediante funciones de color de múltiples escalas, modelos jerárquicos y filtrado de partículas", Actas de la Quinta Conferencia Internacional IEEE sobre reconocimiento automático de rostros y gestos, Washington, DC, EE. UU., 21-21 Mayo de 2002, páginas 423-428. ISBN 0-7695-1602-5 , doi :10.1109/AFGR.2002.1004190
^ Domitilla Del Vecchio , Richard M. Murray Pietro Perona, "Descomposición del movimiento humano en primitivas basadas en dinámica con aplicación a tareas de dibujo" Archivado el 2 de febrero de 2010 en Wayback Machine , Automatica Volumen 39, Número 12, diciembre de 2003, Páginas 2085–2098, doi :10.1016/S0005-1098(03)00250-4.
^ Thomas B. Moeslund y Lau Nørgaard, "Una breve descripción de los gestos con las manos utilizados en interfaces de computadora humana portátiles" Archivado el 19 de julio de 2011 en Wayback Machine , Informe técnico: CVMT 03-02, ISSN 1601-3646, Laboratorio de Computación Tecnología de Visión y Medios, Universidad de Aalborg, Dinamarca.
^ M. Kolsch y M. Turk "Seguimiento manual rápido en 2D con multitud de funciones e integración de múltiples señales" Archivado el 21 de agosto de 2008 en Wayback Machine , CVPRW '04. Actas del Taller de reconocimiento de patrones y visión por computadora, del 27 de mayo al 2 de junio de 2004, doi :10.1109/CVPR.2004.71
^ Xia Liu Fujimura, K., "Reconocimiento de gestos con las manos utilizando datos de profundidad", Actas de la Sexta Conferencia Internacional IEEE sobre reconocimiento automático de rostros y gestos, 17 al 19 de mayo de 2004, páginas 529 a 534, ISBN 0-7695-2122-3 , doi :10.1109/AFGR.2004.1301587.
^ Stenger B, Thayananthan A, Torr PH, Cipolla R: "Seguimiento manual basado en modelos utilizando un filtro bayesiano jerárquico", IEEE Transactions on IEEE Transactions on Pattern Analysis and Machine Intelligence, 28(9):1372-84, septiembre de 2006.
^ A Erol, G Bebis, M Nicolescu, RD Boyle, X Twombly, "Estimación de la pose de la mano basada en la visión: una revisión", Visión por computadora y comprensión de la imagen Volumen 108, números 1 y 2, octubre-noviembre de 2007, páginas 52-73 Número especial sobre la visión de la interacción persona-computadora, doi :10.1016/j.cviu.2006.10.012.
^ ab Rico, Julie; Brewster, Stephen (2010). "Gestos utilizables para interfaces móviles". Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . CHI '10. Nueva York, NY, Estados Unidos: ACM. págs. 887–896. doi :10.1145/1753326.1753458. ISBN9781605589299. S2CID 16118067.
^ ab Walter, Robert; Bailly, Gilles; Müller, Jörg (2013). "StrikeAPose". Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . Nueva York, Nueva York, Estados Unidos: ACM Press. págs. 841–850. doi :10.1145/2470654.2470774. ISBN9781450318990. S2CID 2041073.
^ ab Profita, Halley P.; Clawson, James; Gilliland, Scott; Zeagler, Clint; Starner, Thad; Budd, Jim; Hacer, Ellen Yi-Luen (2013). "No te importe que me toque la muñeca". Actas del Simposio internacional sobre computadoras portátiles de 2013 . ISWC '13. Nueva York, NY, Estados Unidos: ACM. págs. 89–96. doi :10.1145/2493988.2494331. ISBN9781450321273. S2CID 3236927.
^ Harrison, Chris; Faste, Haakon (2014). "Implicaciones de la ubicación y el tacto para las interfaces proyectadas en el cuerpo". Actas de la conferencia de 2014 sobre Diseño de sistemas interactivos . DIS '14. Nueva York, NY, Estados Unidos: ACM. págs. 543–552. doi :10.1145/2598510.2598587. ISBN9781450329026. S2CID 1121501.
^ ab Reeves, Estuardo; Benford, Steve; O'Malley, Claire; Fraser, Mike (2005). «Diseñando la experiencia del espectador» (PDF) . Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos (PDF) . Nueva York, Nueva York, Estados Unidos: ACM Press. págs. 741–750. doi :10.1145/1054972.1055074. ISBN978-1581139983. S2CID 5739231.
^ Rupert Goodwins. "¿Windows 7? No tiene brazo". ZDNet .
^ "brazo de gorila". catb.org .
^ Hincapié-Ramos, JD, Guo, X., Moghadasian, P. e Irani. P. 2014. "Resistencia consumida: una métrica para cuantificar la fatiga del brazo en las interacciones en el aire". En Actas de la 32ª conferencia anual de ACM sobre factores humanos en sistemas informáticos (CHI '14). ACM, Nueva York, NY, EE. UU., 1063–1072. DOI=10.1145/2556288.2557130
^ Hincapié-Ramos, JD, Guo, X. e Irani, P. 2014. "El banco de trabajo de resistencia consumido: una herramienta para evaluar la fatiga del brazo durante las interacciones en el aire". En Actas de la publicación complementaria de 2014 sobre Diseño de sistemas interactivos (DIS Companion '14). ACM, Nueva York, NY, EE.UU., 109-112. DOI=10.1145/2598784.2602795
enlaces externos
Bibliografía comentada de referencias a la computación con gestos y lápiz.
Notas sobre la historia de la informática basada en lápiz (YouTube)
El futuro, todo es un gesto: interfaces de gestos y videojuegos
Anuncio gestualmente interactivo de Ford: gestos utilizados para interactuar con la señalización digital
Seguimiento de manos en 3D: un estudio de la literatura