Esquema de codificación de datos

El esquema de codificación de datos es un campo de un octeto en mensajes cortos (SM) y mensajes de difusión celular (CB) que transmite información básica sobre cómo el teléfono del destinatario debe procesar el mensaje recibido. La información incluye:

el juego de caracteres o codificación del mensaje, que determina la codificación de los datos del usuario del mensaje
la clase de mensaje, que determina a qué componente de la estación móvil (MS) o equipo de usuario (UE) se debe entregar el mensaje
la solicitud para eliminar automáticamente el mensaje después de leerlo
el estado de las banderas que indican la presencia de correo de voz, fax, correo electrónico u otros mensajes no leídos
la indicación de que el contenido del mensaje está comprimido
el idioma del mensaje de difusión celular

El campo se describe en 3GPP 23.040 y 3GPP 23.038 con el nombre TP-DCS.

Juegos de caracteres de mensajes

Se diseñó una codificación especial de 7 bits llamada alfabeto predeterminado de 7 bits GSM para el sistema de mensajes cortos en GSM. El alfabeto contiene los símbolos más utilizados de la mayoría de los idiomas de Europa occidental (y algunas letras mayúsculas griegas). Algunos caracteres ASCII y el signo del euro no encajan en el alfabeto predeterminado de 7 bits GSM y deben codificarse mediante dos septetos. Estos caracteres forman la tabla de extensión del alfabeto predeterminado GSM de 7 bits . La compatibilidad con el alfabeto GSM de 7 bits es obligatoria para los teléfonos y elementos de red GSM. ^[1]

Los idiomas que utilizan escritura latina , pero que utilizan caracteres que no están presentes en el alfabeto GSM predeterminado de 7 bits, a menudo reemplazan los caracteres faltantes con signos diacríticos con caracteres correspondientes sin signos diacríticos, lo que provoca una experiencia de usuario no del todo satisfactoria, pero a menudo se acepta. Para incluir estos caracteres faltantes se puede utilizar la codificación UTF-16 de 16 bits (en GSM llamada UCS-2) al precio de reducir la longitud de un mensaje (no segmentado) de 160 a 70 caracteres.

Los mensajes en chino, coreano o japonés deben codificarse utilizando la codificación de caracteres UTF-16 . Lo mismo se aplica a otros idiomas que utilizan escrituras no latinas, como el ruso, el árabe, el hebreo y varios idiomas indios. En 3GPP TS 23.038 8.0.0 publicado en 2008 se introdujo una nueva característica, una tabla de cambio de idioma nacional extendida, que en la versión 11.0.0 publicada en 2012 cubre turco , español , portugués , bengalí , gujarati , hindi , kannada , malayalam , Idiomas oriya , punjabi , tamil , telugu y urdu . El mecanismo reemplaza la tabla de códigos alfabéticos predeterminados de 7 bits GSM y/o la tabla extendida con una tabla nacional de acuerdo con elementos de información especiales en el encabezado de datos del usuario . El mensaje no segmentado que utiliza tablas de cambio de idioma nacional puede contener hasta 155 (o 153) caracteres de 7 bits.

GSM reconoce sólo dos codificaciones para mensajes de texto y una codificación para mensajes binarios :

Alfabeto predeterminado GSM de 7 bits (que también incluye el uso de tablas de cambio de idioma nacional)
UCS-2
datos de 8 bits

Clases de mensajes

El octeto TP-DCS tiene una sintaxis compleja que permite transportar otra información; las más notables son las clases de mensajes:

Los mensajes flash se reciben en un teléfono móvil aunque tenga la memoria llena. No se almacenan en el teléfono, simplemente se muestran en la pantalla del teléfono.

Otras características

Eliminación automática después de la lectura.

El teléfono debe eliminar cualquier mensaje recibido con un valor TP-DCS que pertenezca al "Grupo de codificación de mensaje marcado para eliminación automática" después de que el usuario lo haya leído.

Indicación de mensaje en espera

El grupo de valores DCS de indicación de mensaje en espera sirve para configurar o restablecer indicadores que indican la presencia de correo de voz , fax , correo electrónico u otros mensajes no leídos.

Compresión de datos

Un valor DCS especial también permite la compresión de mensajes , pero quizás ningún operador lo utilice.

Valores DCS

Esquema de codificación de datos SMS

Los valores de TP-DCS están definidos en la recomendación GSM 03.38 . ^[1]

El estándar móvil iDEN utiliza los valores F7 ₁₆ y F8 ₁₆ de forma especial.

Esquema de codificación de datos CBS

Para conocer los valores de DCS en mensajes de difusión celular, consulte la recomendación GSM 03.38 . ^[1]

Ver también

Referencias

^ abc 3GPP TS 23.038, Alfabetos e información específica del idioma.