Iniciativa del Consorcio World Wide Web
La Actividad de Interacción Multimodal es una iniciativa del W3C que tiene como objetivo proporcionar medios (principalmente XML ) para apoyar escenarios de interacción multimodal en la Web .
Esta actividad se inició en 2002. El grupo de trabajo del Marco de Interacción Multimodal ya ha elaborado:
- el Marco de Interacción Multimodal, que proporciona un marco general para la interacción multimodal , y los tipos de lenguajes de marcado que se están considerando.
- Un conjunto de casos de uso .
- Un conjunto de requisitos básicos, que describe los requisitos fundamentales que deben abordarse en las especificaciones futuras.
El conjunto de dispositivos que se consideran son los teléfonos móviles , la telemática del automóvil, los PC conectados a la Web .
Trabajo actual
Las siguientes especificaciones XML (actualmente en estado avanzado de borrador de trabajo) ya abordan varias partes de los requisitos básicos:
- EMMA (Extensible Multi-Modal Annotations) : formato de intercambio de datos para la interfaz entre procesadores de entrada y sistemas de gestión de interacción. Definirá los medios para que los reconocedores anoten datos específicos de la aplicación con información como puntuaciones de confianza, marcas de tiempo, modo de entrada (por ejemplo, pulsaciones de teclas, voz o lápiz), hipótesis de reconocimiento alternativas y resultados de reconocimiento parcial, etc.
- InkML – un lenguaje XML para trazos de tinta digital: un formato de intercambio de datos XML para tinta ingresada con un bolígrafo o lápiz electrónico como parte de un sistema multimodal.
- Arquitectura multimodal : una arquitectura acoplada de forma flexible para el marco de interacción multimodal que se centra en proporcionar un medio general para que los componentes se comuniquen entre sí, además de una infraestructura básica para el control de aplicaciones y los servicios de plataforma.
- Lenguaje de marcado de emociones : EmotionML proporcionará representaciones de emociones y estados relacionados para aplicaciones tecnológicas.
Véase también
- Interacción multimodal
- VoiceXML : el formato XML estándar del W3C para especificar diálogos de voz interactivos entre un humano y una computadora.
- SSML – Lenguaje de marcado de síntesis de voz
- CCXML – Lenguaje de marcado extensible para control de llamadas
- SCXML : un lenguaje XML que proporciona un entorno de ejecución genérico basado en una máquina de estados
Enlaces útiles
- Actividad de interacción multimodal en el sitio W3C
- La arquitectura multimodal del W3C, parte 1: descripción general y desafíos de IBM DeveloperWorks