Iniciativa del Consorcio World Wide Web
La Actividad de Interacción Multimodal es una iniciativa del W3C que tiene como objetivo proporcionar medios (principalmente XML ) para soportar escenarios de interacción multimodal en la Web .
Esta actividad se lanzó en 2002. El grupo de trabajo del Marco de Interacción Multimodal ya ha producido:
- el Marco de Interacción Multimodal, que proporciona un marco general para la interacción multimodal , y los tipos de lenguajes de marcado que se están considerando.
- Un conjunto de casos de uso .
- Un conjunto de requisitos básicos, que describe los requisitos fundamentales a abordar en las especificaciones futuras.
El conjunto de dispositivos que se consideran son teléfonos móviles , telemática automotriz, PC conectados a la Web .
Trabajo actual
Las siguientes especificaciones XML (actualmente en estado de borrador de trabajo avanzado) ya abordan varias partes de los requisitos básicos:
- EMMA (Anotaciones multimodales extensibles) : un formato de intercambio de datos para la interfaz entre procesadores de entrada y sistemas de gestión de interacción. Definirá los medios para que los reconocedores anoten datos específicos de la aplicación con información como puntuaciones de confianza, marcas de tiempo, modo de entrada (por ejemplo, pulsaciones de teclas, voz o lápiz), hipótesis de reconocimiento alternativas y resultados de reconocimiento parcial, etc.
- InkML : un lenguaje XML para trazos de tinta digital: un formato de intercambio de datos XML para tinta ingresada con un bolígrafo o lápiz electrónico como parte de un sistema multimodal.
- Arquitectura multimodal : una arquitectura débilmente acoplada para el marco de interacción multimodal que se centra en proporcionar un medio general para que los componentes se comuniquen entre sí, además de una infraestructura básica para el control de aplicaciones y servicios de plataforma.
- Lenguaje de marcado de emociones : EmotionML proporcionará representaciones de emociones y estados relacionados para aplicaciones tecnológicas.
Ver también
- Interacción multimodal
- VoiceXML : el formato XML estándar del W3C para especificar diálogos de voz interactivos entre un humano y una computadora.
- SSML : lenguaje de marcado de síntesis de voz
- CCXML : lenguaje de marcado extensible de control de llamadas
- SCXML : un lenguaje XML que proporciona un entorno de ejecución genérico basado en una máquina de estados
Enlaces útiles
- Actividad de interacción multimodal en el sitio del W3C
- La arquitectura multimodal del W3C, Parte 1: descripción general y desafíos en IBM DeveloperWorks