Shumin Zhai (chino simplificado: 翟树民) (nacido en 1961) es un científico e inventor estadounidense-canadiense de interacción persona-computadora (HCI) nacido en China. [ cita necesaria ] Es conocido por su investigación específicamente sobre dispositivos de entrada y métodos de interacción, teclados de pantalla táctil basados en gestos de deslizamiento, interfaces de seguimiento ocular y modelos de desempeño humano en la interacción persona-computadora. Sus estudios han contribuido tanto a los modelos fundamentales como a la comprensión de HCI y a diseños prácticos de interfaces de usuario y productos emblemáticos. Anteriormente trabajó en IBM , donde inventó el método de entrada de texto ShapeWriter para teléfonos inteligentes, que es un predecesor del moderno teclado Swype . [1] [2] Las publicaciones del Dr. Zhai han ganado el premio ACM UIST Lasting Impact Award y el premio IEEE Computer Society Best Paper, entre otros, y es más conocido por su investigación específicamente sobre dispositivos de entrada y métodos de interacción, deslizar-gesto- teclados de pantalla táctil, interfaces de seguimiento ocular y modelos de desempeño humano en la interacción persona-computadora. El Dr. Zhai es actualmente científico principal en Google , donde lidera y dirige la investigación, el diseño y el desarrollo de métodos de entrada y sistemas hápticos de dispositivos humanos.
Nacido en Harbin , China en 1961, el Dr. Zhai recibió su licenciatura en Ingeniería Eléctrica en 1982 y su maestría en Ciencias de la Computación en 1984 en la Universidad de Xidian . Después de eso, trabajó en la facultad del Instituto Noroeste de Ingeniería de Telecomunicaciones (ahora Universidad Xidian) en Xi'an , China , donde enseñó y realizó investigaciones en sistemas de control por computadora hasta 1989. En 1995, recibió su doctorado en Ingeniería de Factores Humanos. en la Universidad de Toronto . [3]
De 2001 a 2007, el Dr. Zhai fue profesor adjunto visitante en el Departamento de Informática y Ciencias de la Información (IDA) de la Universidad de Linköping , donde también supervisó investigaciones de posgrado.
Fue consultor en Autodesk en 1995 antes de incorporarse al IBM Almaden Research Center en 1996.
De 1996 a 2011 trabajó en el Centro de Investigación IBM Almaden . En enero de 2007, originó y dirigió el proyecto SHARK/ ShapeWriter en IBM Research y una nueva empresa que fue pionera en el paradigma del teclado con pantalla táctil y gestos de palabras, presentando las primeras patentes de este paradigma y publicando la primera generación de artículos científicos. [4] En 2010, ShapeWriter fue adquirida por Nuance Communications y retirada del mercado. Durante su mandato en IBM, el Dr. Zhai también trabajó con un equipo de ingenieros de IBM y proveedores de IBM para llevar el mouse ScrollPoint de la investigación al mercado, y recibió un premio CES y millones de usuarios.
De 2009 a 2015, el Dr. Zhai también fue editor en jefe de ACM Transactions on Computer-Human Interaction . En ese momento, había estado profundamente involucrado tanto en el lado de la conferencia como en el lado de la revista de la publicación de investigaciones de HCI como autor, revisor, editor, miembro del comité y presidente de artículos. [5] [6]
Desde 2011 hasta la actualidad, el Dr. Zhai ha estado trabajando en Google como científico principal, donde lidera y dirige la investigación, el diseño y el desarrollo de métodos de entrada de dispositivos humanos y sistemas hápticos. Específicamente, ha dirigido la investigación y el diseño de los productos de teclado de Google, la tecnología háptica de los teléfonos Pixel y los novedosos métodos de invocación del Asistente de Google. En particular, el Dr. Zhai dirigió el diseño de Active Edge, una característica principal de Google Pixel 2 , que permite al usuario acceder al Asistente de Google de forma más rápida e intuitiva mediante un suave apretón del dispositivo en lugar de la pantalla táctil.
El Dr. Zhai investiga principalmente en la interacción persona-computadora y actualmente trabaja en la investigación, diseño y desarrollo de métodos de entrada de texto y manuales y sistemas hápticos. Además de la entrada de texto y la háptica, sus otros intereses de investigación incluyen el diseño de interfaz de usuario del sistema, modelado del desempeño humano, interacción multimodal , dispositivos y métodos de entrada de computadora y teorías de la interacción persona-computadora. [7] Ha publicado más de 200 artículos de investigación [8] y recibió 30 patentes. [9]
En 2003, el Dr. Zhai y Per Ola Kristensson propusieron un método de escritura rápida para computación basada en lápiz, SHARK (teclado rápido asistido por taquigrafía), que aumenta el teclado con lápiz óptico con gestos taquigráficos. SHARK define un símbolo taquigráfico para cada palabra según su patrón de movimiento en un teclado con lápiz optimizado. [10] En 2004, presentaron SHARK 2 que aumentó la precisión del reconocimiento y relajó los requisitos de precisión mediante el uso de la forma y ubicación de los gestos además de modelos de lenguaje basados en el contexto. [11] Al hacerlo, el Dr. Zhai y Kristensson presentaron un paradigma de escritura por gestos en la pantalla táctil [12] como un método eficiente para la entrada de texto que ha seguido impulsando el desarrollo de la entrada de texto móvil en toda la industria. [4] Una de las razones más importantes de los teclados gestuales es facilitar la transición del rastreo de letra a letra con guía principalmente visual a los gestos impulsados por la recuperación de la memoria. [13] Al lanzar el primer teclado de gestos de palabras en 2004 a través de IBM AlphaWorks y una aplicación de iPhone de primer nivel llamada ShapeWriter WritingPad en 2008, [14] el Dr. Zhai y sus colegas pudieron facilitar esta transición y sacaron el invento del laboratorio. a usuarios del mundo real. [15]
Uno de los principales hilos de investigación de HCI del Dr. Zhai es el tipo de ley de Fitts de los modelos de desempeño humano. Desde 1996, el Dr. Zhai, junto con sus colegas, ha realizado investigaciones sobre las "Leyes de acción" que intentaban llevar adelante el espíritu de la ley de Fitts . En el contexto de HCI , la ley de Fitts puede considerarse la "Ley de señalar", mientras que creen que existen otras regularidades sólidas del desempeño humano en acción. Las dos nuevas clases de acción relevantes para el diseño y la evaluación de la interfaz de usuario que han explorado son el cruce y la dirección. [dieciséis]
El Dr. Zhai comenzó a trabajar en entradas de múltiples grados de libertad (DOF) durante sus años de posgrado en la Universidad de Toronto . En su doctorado. En su tesis, examinó sistemáticamente el desempeño humano en función de las variaciones de diseño de un dispositivo de control de 6 grados de libertad, como la resistencia de control (isométrica, elástica e isotónica), la función de transferencia (control de posición versus velocidad), los grupos de músculos utilizados y el formato de visualización. . Investigó la capacidad de las personas para coordinar múltiples grados de libertad, basándose en tres formas de cuantificación: tiempo simultáneo en el objetivo, correlación de errores y eficiencia.
El Dr. Zhai ha estado involucrado en dos aplicaciones sobre interfaces de usuario aumentadas con seguimiento ocular, MAGIC pointing y RealTourist. [23]
En 1999, trabajó junto con sus colegas ( Carlos Morimoto y Steven Ihde) en el IBM Almaden Research Center y publicó un artículo Manual and gaze input cascaded (MAGIC) pointing . Este trabajo exploró una nueva dirección en la utilización de la mirada para la entrada de datos por computadora, demostrando que las técnicas de apuntar con MAGIC podrían ofrecer muchas ventajas, incluyendo menos esfuerzo físico y fatiga que el apuntar manual tradicional, mayor precisión y naturalidad que el apuntar con la mirada tradicional, y posiblemente una velocidad más rápida que el apuntar con la mirada. apuntamiento manual. [24]
En 2005, desarrolló y estudió un sistema experimental, RealTourist, con Pernilla Qvarfordt y David Beymer. RealTourist permite al usuario planificar un viaje de conferencia con la ayuda de un asesor turístico remoto que podría ver la mirada del turista superpuesta en un mapa compartido. Los datos recopilados durante el experimento se analizaron junto con una revisión de la literatura sobre los patrones del habla y la mirada. Esta investigación exploratoria e inspectiva identificó varias funciones de la superposición de la mirada en material espacial compartido, entre ellas: visualización precisa y directa de la mirada del compañero, referencias deícticas implícitas, detección de intereses, enfoque común y cambio de tema, mayor redundancia y reducción de la ambigüedad, y un aumento de seguridad, confianza y comprensión. Este estudio identificó patrones que pueden servir como base para diseñar sistemas multimodales de diálogo entre humanos y computadoras con el lugar de la mirada como canal contribuyente, e investigó cómo la comunicación mediada por computadora puede ser respaldada por la visualización de la mirada de la pareja. [25]
FonePal es un sistema desarrollado para mejorar la experiencia de acceder a centros de llamadas o mesas de ayuda. Conocida como el "infierno de los tonos", la navegación por el menú de voz ha sido reconocida durante mucho tiempo como una experiencia de usuario frustrante debido a la naturaleza de la presentación de voz. Por el contrario, FonePal permite al usuario escanear y seleccionar en un menú visual a su propio ritmo, normalmente mucho más rápido que esperar a que se pronuncien los menús de voz. FonePal utiliza la infraestructura de Internet, específicamente la mensajería instantánea, para ofrecer un menú visual en la pantalla de una computadora cercana simultáneamente con el menú de voz en el teléfono. [26]
En 2005 y 2006, el Dr. Zhai y su colega Min Yin del IBM Almaden Research Center publicaron dos artículos sobre este proyecto. Su estudio muestra que FonePal permite una navegación más sencilla en el árbol telefónico IVR , una mayor velocidad de navegación, menos errores de enrutamiento y una mayor satisfacción. FonePal también puede conectar fácilmente a la persona que llama con una base de conocimiento web con capacidad de búsqueda, promoviendo la autoayuda relevante y reduciendo el costo de operación del centro de llamadas. [27] [28]
El Dr. Zhai es miembro de la Association for Computing Machinery (ACM) y miembro de la CHI Academy . Ha recibido numerosos premios y honores. Entre ellos:
{{cite web}}
: Mantenimiento CS1: nombres numéricos: lista de autores ( enlace )