stringtranslate.com

Caracteres válidos en XML

Este artículo describe y clasifica los caracteres Unicode que pueden aparecer válidamente en XML .

XML 1.0

Los puntos de código Unicode en los siguientes rangos son válidos en documentos XML 1.0: [1]

Los rangos de puntos de código anteriores contienen los siguientes controles que solo son válidos en ciertos contextos en documentos XML 1.0 y cuyo uso está restringido y se desaconseja enfáticamente:

XML 1.1

Los puntos de código Unicode en los siguientes rangos de puntos de código siempre son válidos en los documentos XML 1.1: [2]

Los rangos de puntos de código anteriores contienen los siguientes controles que solo son válidos en ciertos contextos en documentos XML 1.1 y cuyo uso está restringido y se desaconseja enfáticamente:

Caracteres permitidos pero no recomendados

Además, los siguientes puntos de código, aunque son válidos en todos los documentos XML 1.0 y XML 1.1, también están restringidos y se desaconsejan en ambas versiones de XML, ya que están asignados permanentemente a caracteres no codificados en Unicode e ISO/IEC 10646. Algunos analizadores XML pueden incluso señalarlos como no válidos en su decodificador de conjuntos de caracteres, y los documentos XML que los contienen pueden no pasar por algunas interfaces restringidas o pueden no ser intercambiables. Estos caracteres no codificados aún pueden codificarse en UTF estándar (como UTF-8 ) porque estos UTF solo restringen los puntos de código asignados a caracteres no codificados sustitutos:

Tenga en cuenta que el punto de código U+0000, asignado al carácter de control nulo, es el único carácter codificado en Unicode e ISO/IEC 10646 que siempre es inválido en cualquier documento XML 1.0 y 1.1.

Por el contrario, el punto de código U+0085 es un carácter de control válido en Unicode e ISO/IEC 10646, así como en documentos XML 1.0 y XML 1.1 (en todos los contextos), y no se desaconseja su uso (se trata como un espacio en blanco en muchos contextos XML, o como un control de salto de línea similar a U+000D y U+000A en textos preformateados en algunas aplicaciones XML).

Caracteres sin restricciones

Por estos motivos, el repertorio no restringido que se puede utilizar en todas las versiones de XML y en todos los contextos (según lo permita la sintaxis XML) contiene únicamente puntos de código que están asignados permanentemente a caracteres (excluyendo los que no son caracteres) o reservados para una posible codificación futura en Unicode e ISO/IEC 10646, y excluye el repertorio restringido, para una mejor interoperabilidad. Son:

Véase también

Referencias

  1. ^ "Lenguaje de marcado extensible (XML) 1.0 (cuarta edición)". www.w3.org .
  2. ^ "Lenguaje de marcado extensible (XML) 1.1 (segunda edición)". www.w3.org .