stringtranslate.com

Shumin Zhai

Shumin Zhai (chino simplificado: 翟树民) (nacido en 1961) es un científico e inventor estadounidense-canadiense de interacción persona-computadora (HCI) nacido en China. [ cita necesaria ] Es conocido por su investigación específicamente sobre dispositivos de entrada y métodos de interacción, teclados de pantalla táctil basados ​​en gestos de deslizamiento, interfaces de seguimiento ocular y modelos de desempeño humano en la interacción persona-computadora. Sus estudios han contribuido tanto a los modelos fundamentales como a la comprensión de HCI y a diseños prácticos de interfaces de usuario y productos emblemáticos. Anteriormente trabajó en IBM , donde inventó el método de entrada de texto ShapeWriter para teléfonos inteligentes, que es un predecesor del moderno teclado Swype . [1] [2] Las publicaciones del Dr. Zhai han ganado el premio ACM UIST Lasting Impact Award y el premio IEEE Computer Society Best Paper, entre otros, y es más conocido por su investigación específicamente sobre dispositivos de entrada y métodos de interacción, deslizar-gesto- teclados de pantalla táctil, interfaces de seguimiento ocular y modelos de desempeño humano en la interacción persona-computadora. El Dr. Zhai es actualmente científico principal en Google , donde lidera y dirige la investigación, el diseño y el desarrollo de métodos de entrada y sistemas hápticos de dispositivos humanos.

Educación

Nacido en Harbin , China en 1961, el Dr. Zhai recibió su licenciatura en Ingeniería Eléctrica en 1982 y su maestría en Ciencias de la Computación en 1984 en la Universidad de Xidian . Después de eso, trabajó en la facultad del Instituto Noroeste de Ingeniería de Telecomunicaciones (ahora Universidad Xidian) en Xi'an , China , donde enseñó y realizó investigaciones en sistemas de control por computadora hasta 1989. En 1995, recibió su doctorado en Ingeniería de Factores Humanos. en la Universidad de Toronto . [3]

Carrera

De 2001 a 2007, el Dr. Zhai fue profesor adjunto visitante en el Departamento de Informática y Ciencias de la Información (IDA) de la Universidad de Linköping , donde también supervisó investigaciones de posgrado.

Fue consultor en Autodesk en 1995 antes de incorporarse al IBM Almaden Research Center en 1996.

De 1996 a 2011 trabajó en el Centro de Investigación IBM Almaden . En enero de 2007, originó y dirigió el proyecto SHARK/ ShapeWriter en IBM Research y una nueva empresa que fue pionera en el paradigma del teclado con pantalla táctil y gestos de palabras, presentando las primeras patentes de este paradigma y publicando la primera generación de artículos científicos. [4] En 2010, ShapeWriter fue adquirida por Nuance Communications y retirada del mercado. Durante su mandato en IBM, el Dr. Zhai también trabajó con un equipo de ingenieros de IBM y proveedores de IBM para llevar el mouse ScrollPoint de la investigación al mercado, y recibió un premio CES y millones de usuarios.

De 2009 a 2015, el Dr. Zhai también fue editor en jefe de ACM Transactions on Computer-Human Interaction . En ese momento, había estado profundamente involucrado tanto en el lado de la conferencia como en el lado de la revista de la publicación de investigaciones de HCI como autor, revisor, editor, miembro del comité y presidente de artículos. [5] [6]

Desde 2011 hasta la actualidad, el Dr. Zhai ha estado trabajando en Google como científico principal, donde lidera y dirige la investigación, el diseño y el desarrollo de métodos de entrada de dispositivos humanos y sistemas hápticos. Específicamente, ha dirigido la investigación y el diseño de los productos de teclado de Google, la tecnología háptica de los teléfonos Pixel y los novedosos métodos de invocación del Asistente de Google. En particular, el Dr. Zhai dirigió el diseño de Active Edge, una característica principal de Google Pixel 2 , que permite al usuario acceder al Asistente de Google de forma más rápida e intuitiva mediante un suave apretón del dispositivo en lugar de la pantalla táctil.

Trabajar

El Dr. Zhai investiga principalmente en la interacción persona-computadora y actualmente trabaja en la investigación, diseño y desarrollo de métodos de entrada de texto y manuales y sistemas hápticos. Además de la entrada de texto y la háptica, sus otros intereses de investigación incluyen el diseño de interfaz de usuario del sistema, modelado del desempeño humano, interacción multimodal , dispositivos y métodos de entrada de computadora y teorías de la interacción persona-computadora. [7] Ha publicado más de 200 artículos de investigación [8] y recibió 30 patentes. [9]

Teclado de gestos de palabras

En 2003, el Dr. Zhai y Per Ola Kristensson propusieron un método de escritura rápida para computación basada en lápiz, SHARK (teclado rápido asistido por taquigrafía), que aumenta el teclado con lápiz óptico con gestos taquigráficos. SHARK define un símbolo taquigráfico para cada palabra según su patrón de movimiento en un teclado con lápiz optimizado. [10] En 2004, presentaron SHARK 2 que aumentó la precisión del reconocimiento y relajó los requisitos de precisión mediante el uso de la forma y ubicación de los gestos además de modelos de lenguaje basados ​​en el contexto. [11] Al hacerlo, el Dr. Zhai y Kristensson presentaron un paradigma de escritura por gestos en la pantalla táctil [12] como un método eficiente para la entrada de texto que ha seguido impulsando el desarrollo de la entrada de texto móvil en toda la industria. [4] Una de las razones más importantes de los teclados gestuales es facilitar la transición del rastreo de letra a letra con guía principalmente visual a los gestos impulsados ​​por la recuperación de la memoria. [13] Al lanzar el primer teclado de gestos de palabras en 2004 a través de IBM AlphaWorks y una aplicación de iPhone de primer nivel llamada ShapeWriter WritingPad en 2008, [14] el Dr. Zhai y sus colegas pudieron facilitar esta transición y sacaron el invento del laboratorio. a usuarios del mundo real. [15]

Leyes y modelos de actuación.

Uno de los principales hilos de investigación de HCI del Dr. Zhai es el tipo de ley de Fitts de los modelos de desempeño humano. Desde 1996, el Dr. Zhai, junto con sus colegas, ha realizado investigaciones sobre las "Leyes de acción" que intentaban llevar adelante el espíritu de la ley de Fitts . En el contexto de HCI , la ley de Fitts puede considerarse la "Ley de señalar", mientras que creen que existen otras regularidades sólidas del desempeño humano en acción. Las dos nuevas clases de acción relevantes para el diseño y la evaluación de la interfaz de usuario que han explorado son el cruce y la dirección. [dieciséis]

Manipulación y navegación en interfaces 3D.

El Dr. Zhai comenzó a trabajar en entradas de múltiples grados de libertad (DOF) durante sus años de posgrado en la Universidad de Toronto . En su doctorado. En su tesis, examinó sistemáticamente el desempeño humano en función de las variaciones de diseño de un dispositivo de control de 6 grados de libertad, como la resistencia de control (isométrica, elástica e isotónica), la función de transferencia (control de posición versus velocidad), los grupos de músculos utilizados y el formato de visualización. . Investigó la capacidad de las personas para coordinar múltiples grados de libertad, basándose en tres formas de cuantificación: tiempo simultáneo en el objetivo, correlación de errores y eficiencia.

Interfaces de usuario aumentadas con seguimiento ocular

El Dr. Zhai ha estado involucrado en dos aplicaciones sobre interfaces de usuario aumentadas con seguimiento ocular, MAGIC pointing y RealTourist. [23]

En 1999, trabajó junto con sus colegas ( Carlos Morimoto y Steven Ihde) en el IBM Almaden Research Center y publicó un artículo Manual and gaze input cascaded (MAGIC) pointing . Este trabajo exploró una nueva dirección en la utilización de la mirada para la entrada de datos por computadora, demostrando que las técnicas de apuntar con MAGIC podrían ofrecer muchas ventajas, incluyendo menos esfuerzo físico y fatiga que el apuntar manual tradicional, mayor precisión y naturalidad que el apuntar con la mirada tradicional, y posiblemente una velocidad más rápida que el apuntar con la mirada. apuntamiento manual. [24]

En 2005, desarrolló y estudió un sistema experimental, RealTourist, con Pernilla Qvarfordt y David Beymer. RealTourist permite al usuario planificar un viaje de conferencia con la ayuda de un asesor turístico remoto que podría ver la mirada del turista superpuesta en un mapa compartido. Los datos recopilados durante el experimento se analizaron junto con una revisión de la literatura sobre los patrones del habla y la mirada. Esta investigación exploratoria e inspectiva identificó varias funciones de la superposición de la mirada en material espacial compartido, entre ellas: visualización precisa y directa de la mirada del compañero, referencias deícticas implícitas, detección de intereses, enfoque común y cambio de tema, mayor redundancia y reducción de la ambigüedad, y un aumento de seguridad, confianza y comprensión. Este estudio identificó patrones que pueden servir como base para diseñar sistemas multimodales de diálogo entre humanos y computadoras con el lugar de la mirada como canal contribuyente, e investigó cómo la comunicación mediada por computadora puede ser respaldada por la visualización de la mirada de la pareja. [25]

FonePal

FonePal es un sistema desarrollado para mejorar la experiencia de acceder a centros de llamadas o mesas de ayuda. Conocida como el "infierno de los tonos", la navegación por el menú de voz ha sido reconocida durante mucho tiempo como una experiencia de usuario frustrante debido a la naturaleza de la presentación de voz. Por el contrario, FonePal permite al usuario escanear y seleccionar en un menú visual a su propio ritmo, normalmente mucho más rápido que esperar a que se pronuncien los menús de voz. FonePal utiliza la infraestructura de Internet, específicamente la mensajería instantánea, para ofrecer un menú visual en la pantalla de una computadora cercana simultáneamente con el menú de voz en el teléfono. [26]

En 2005 y 2006, el Dr. Zhai y su colega Min Yin del IBM Almaden Research Center publicaron dos artículos sobre este proyecto. Su estudio muestra que FonePal permite una navegación más sencilla en el árbol telefónico IVR , una mayor velocidad de navegación, menos errores de enrutamiento y una mayor satisfacción. FonePal también puede conectar fácilmente a la persona que llama con una base de conocimiento web con capacidad de búsqueda, promoviendo la autoayuda relevante y reduciendo el costo de operación del centro de llamadas. [27] [28]

Premios y honores

El Dr. Zhai es miembro de la Association for Computing Machinery (ACM) y miembro de la CHI Academy . Ha recibido numerosos premios y honores. Entre ellos:

Referencias

  1. ^ Zhai, Shumin; Kristensson, Per-Ola (2003). "Escritura taquigráfica en el teclado óptico". Actas de la conferencia sobre factores humanos en sistemas informáticos - CHI '03 . ACM. págs. 97-104. doi :10.1145/642611.642630. ISBN 1581136307. S2CID  1697605.
  2. ^ "La recuperación total aumenta la escritura en PDA". 15 de agosto de 2005 . Consultado el 18 de marzo de 2019 .
  3. ^ "08 de noviembre de 1996 Zhai". hci.stanford.edu . Consultado el 26 de abril de 2019 .
  4. ^ abcd "El Googler Shumin Zhai recibe el premio ACM UIST Lasting Impact Award". Blog de IA de Google . 3 de noviembre de 2014 . Consultado el 27 de abril de 2019 .
  5. ^ "Transacciones ACM sobre la interacción computadora-humano". tochi.acm.org . Consultado el 27 de abril de 2019 .
  6. ^ Zhai, Shumin, ed. (Diciembre de 2015). "Transición del editor en jefe de TOCHI: Adiós de Shumin Zhai, bienvenido Ken Hinckley". Transmisión ACM. Comput.-Hum. Interactuar . 22 (6): 27e:1–27e:5. doi : 10.1145/2835174 . ISSN  1073-0516.
  7. ^ Zhai, Shumin. "Acerca de mí". Shumin Zhai . Consultado el 27 de abril de 2019 .
  8. ^ "Shumin Zhai - Citas de Google Scholar". académico.google.com . Consultado el 27 de abril de 2019 .
  9. ^ Waterloo, E5-Ingeniería 5 3102 200 University Avenue West; Canadá, ON N2L 3G1 (09 de abril de 2018). "Seminario CBB: Dr. Shumin Zhai, Google Inc". Ingeniería . Consultado el 27 de abril de 2019 .{{cite web}}: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )
  10. ^ Zhai, Shumin; Kristensson, Per-Ola (2003). "Escritura taquigráfica en el teclado con lápiz óptico". Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . CHI '03. Nueva York, NY, Estados Unidos: ACM. págs. 97-104. doi :10.1145/642611.642630. ISBN 9781581136302. S2CID  1697605.
  11. ^ Kristensson, por Ola; Zhai, Shumin (2004). "SHARK2: un sistema de escritura taquigráfica de amplio vocabulario para computadoras basadas en lápiz. En actas del 17º simposio anual de ACM sobre tecnología y software de interfaz de usuario (UIST '04)". MCA : 43–52. doi :10.1145/1029632.1029640. ISBN 9781581139570. S2CID  3970190 - a través de la biblioteca digital ACM.
  12. ^ US 7251367, Zhai, Shumin, "Sistema y método para reconocer patrones de palabras basados ​​en una distribución de teclado virtual", publicado el 31 de julio de 2007, asignado a IBM 
  13. ^ Zhai, Shumin; Kristensson, Per Ola (2012). "El teclado de palabras y gestos: reinventar la interacción del teclado". Comunicaciones de la ACM . 55 (9 (septiembre de 2012)). MCA: 91–101. doi :10.1145/2330667.2330689. S2CID  566903.
  14. ^ "WritingPad - Principales aplicaciones para iPhone - Hora". Tiempo . 21 de diciembre de 2008.
  15. ^ Zhai, Shumin (2009). "Shapewriter en el iphone: del laboratorio al mundo real". Resúmenes ampliados de CHI '09 sobre factores humanos en sistemas informáticos . CHIEA '09. ACM. págs. 2667–2670. doi :10.1145/1520340.1520380. ISBN 9781605582474. S2CID  12477412 - a través de la biblioteca digital ACM.
  16. ^ "shuminzhai | Proyectos de investigación". Shumin Zhai | . 25 de febrero de 2018 . Consultado el 27 de abril de 2019 .
  17. ^ Accot, Johnny; Zhai, Shumin (2003). "Refinando los modelos de la ley de Fitts para el apuntamiento bivariado". Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . CHI '03. Nueva York, NY, Estados Unidos: ACM. págs. 193-200. doi :10.1145/642611.642646. ISBN 9781581136302. S2CID  5154061.
  18. ^ Zhai, Shumin; Accot, Johnny; Woltjer, Rogier (1 de abril de 2004). "Leyes de acción humana en mundos virtuales electrónicos: un estudio empírico del rendimiento de la dirección de ruta en realidad virtual". Presencia: Teleoperadores y Entornos Virtuales . 13 (2): 113-127. doi :10.1162/1054746041382393. ISSN  1054-7460. S2CID  36408015.
  19. ^ Apitz, Georg; Guimbretière, François; Zhai, Shumin (mayo de 2008). "Fundamentos para el diseño y evaluación de interfaces de usuario basadas en el paradigma del cruce". Transmisión ACM. Comput.-Hum. Interactuar . 17 (2): 9:1–9:42. doi :10.1145/1746259.1746263. ISSN  1073-0516. S2CID  6224916.
  20. ^ Cao, Xiang; Zhai, Shumin (2007). "Modelado de la actuación humana de los gestos de trazo de lápiz". Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . CHI '07. Nueva York, NY, Estados Unidos: ACM. págs. 1495-1504. doi :10.1145/1240624.1240850. ISBN 9781595935939. S2CID  6745302.
  21. ^ Bi, Xiaojun; Li, Yang; Zhai, Shumin (2013). "Ley Fitts". Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . CHI '13. Nueva York, NY, Estados Unidos: ACM. págs. 1363-1372. doi :10.1145/2470654.2466180. ISBN 9781450318990. S2CID  2675893.
  22. ^ Quinn, Felipe; Zhai, Shumin (4 de mayo de 2018). "Modelado de movimientos de escritura de gestos". La interacción persona-ordenador . 33 (3): 234–280. doi :10.1080/07370024.2016.1215922. ISSN  0737-0024. S2CID  4571827.
  23. ^ Shumin Zhai. "Lo que hay en los ojos para una entrada atenta | Marzo de 2003 | Comunicaciones de la ACM". cacm.acm.org . Consultado el 27 de abril de 2019 .
  24. ^ Zhai, Shumin; Morimoto, Carlos; Ihde, Steven (1999). "Señalización en cascada (MAGIC) de entrada manual y de mirada". Actas de la conferencia SIGCHI sobre factores humanos en sistemas informáticos: CHI es el límite: CHI '99 . Nueva York, NY, Estados Unidos: ACM. págs. 246-253. doi :10.1145/302979.303053. ISBN 9780201485592. S2CID  207247711.
  25. ^ Qvarfordt, Pernilla; Beymer, David; Zhai, Shumin (2005). "RealTourist: un estudio sobre cómo aumentar el diálogo entre humanos y entre humanos y computadoras con una superposición de mirada". En Costabile, María Francesca; Paternò, Fabio (eds.). Interacción Persona-Computadora - INTERACT 2005 . Apuntes de conferencias sobre informática. vol. 3585. Springer Berlín Heidelberg. págs. 767–780. doi : 10.1007/11555261_61 . ISBN 9783540317227.
  26. ^ "shuminzhai | Proyectos de investigación". Shumin Zhai | . 25 de febrero de 2018 . Consultado el 27 de abril de 2019 .
  27. ^ Yin, Min; Zhai, Shumin (2005). "Marca y mira". Actas del 18º simposio anual de ACM sobre software y tecnología de interfaz de usuario . UIST '05. Nueva York, NY, Estados Unidos: ACM. págs. 187-190. doi :10.1145/1095034.1095066. ISBN 9781595932716. S2CID  8403712.
  28. ^ Yin, Min; Zhai, Shumin (2006). "Los beneficios de aumentar la navegación por el menú de voz del teléfono con navegación y búsqueda visual". Actas de la Conferencia SIGCHI sobre factores humanos en sistemas informáticos . CHI '06. Nueva York, NY, Estados Unidos: ACM. págs. 319–328. doi :10.1145/1124772.1124821. ISBN 9781595933720. S2CID  16484512.

enlaces externos