stringtranslate.com

Esquema de codificación de datos

El esquema de codificación de datos es un campo de un octeto en los mensajes cortos (SM) y los mensajes de difusión celular (CB) que contiene información básica sobre cómo el teléfono receptor debe procesar el mensaje recibido. La información incluye:

El campo se describe en 3GPP 23.040 y 3GPP 23.038 con el nombre TP-DCS.

Conjuntos de caracteres del mensaje

Para el sistema de mensajes cortos GSM se diseñó una codificación especial de 7 bits denominada alfabeto predeterminado de 7 bits GSM . El alfabeto contiene los símbolos más utilizados de la mayoría de los idiomas de Europa occidental (y algunas letras mayúsculas griegas). Algunos caracteres ASCII y el símbolo del euro no encajaban en el alfabeto predeterminado de 7 bits GSM y debían codificarse utilizando dos septetos. Estos caracteres forman la tabla de extensión del alfabeto predeterminado de 7 bits GSM . La compatibilidad con el alfabeto de 7 bits GSM es obligatoria para los teléfonos móviles y los elementos de red GSM. [1]

Los idiomas que utilizan el alfabeto latino , pero que utilizan caracteres que no están presentes en el alfabeto de 7 bits por defecto de GSM, suelen sustituir los caracteres que faltan por signos diacríticos por caracteres correspondientes sin signos diacríticos, lo que provoca una experiencia de usuario no del todo satisfactoria, pero que suele aceptarse. Para incluir estos caracteres que faltan, se puede utilizar la codificación UTF-16 de 16 bits (en GSM denominada UCS-2) a costa de reducir la longitud de un mensaje (no segmentado) de 160 a 70 caracteres.

Los mensajes en chino, coreano o japonés deben codificarse utilizando la codificación de caracteres UTF-16 . Lo mismo se aplicaba a otros idiomas que utilizaban alfabetos no latinos, como el ruso, el árabe, el hebreo y varios idiomas indios. En 3GPP TS 23.038 8.0.0, publicada en 2008, se introdujo una nueva característica: una tabla de cambio de idioma nacional extendida, que en la versión 11.0.0 publicada en 2012 abarca los idiomas turco , español , portugués , bengalí , gujarati , hindi , kannada , malabar , oriya , punjabi , tamil , telugu y urdu . El mecanismo reemplaza la tabla de código alfabético predeterminado de 7 bits de GSM y/o la tabla extendida con una o más tablas nacionales según los elementos de información especiales en el encabezado de datos de usuario . El mensaje no segmentado que utiliza una o más tablas de cambio de idioma nacional puede llevar hasta 155 (o 153) caracteres de 7 bits.

GSM reconoce sólo dos codificaciones para mensajes de texto y una codificación para mensajes binarios :

Clases de mensajes

El octeto TP-DCS tiene una sintaxis compleja que permite transportar otra información; las más notables son las clases de mensajes:

Los mensajes flash se reciben en un teléfono móvil aunque tenga la memoria llena. No se almacenan en el teléfono, solo se muestran en la pantalla.

Otras características

Eliminación automática después de la lectura

El teléfono debe eliminar cualquier mensaje recibido con un valor TP-DCS que corresponda al "Grupo de codificación de mensaje marcado para eliminación automática" después de que el usuario lo haya leído.

Indicación de mensaje en espera

El grupo de valores DCS de indicación de mensaje en espera sirve para establecer o restablecer indicadores que indican la presencia de mensajes de voz , fax , correo electrónico u otros mensajes no leídos.

Compresión de datos

Un valor DCS especial también permite la compresión de mensajes , pero quizás no lo utilice ningún operador.

Valores DCS

Esquema de codificación de datos SMS

Los valores de TP-DCS están definidos en la recomendación GSM 03.38 . [1]

El estándar móvil iDEN utiliza los valores F7 16 y F8 16 de una manera especial.

Esquema de codificación de datos CBS

Para los valores DCS en los mensajes de difusión celular, consulte la recomendación GSM 03.38 . [1]

Véase también

Referencias

  1. ^ abc 3GPP TS 23.038, Alfabetos e información específica del idioma.