Un documento bien formado en XML es un documento que "cumple las reglas de sintaxis especificadas por la especificación XML 1.0 en el sentido de que debe satisfacer tanto las estructuras físicas como las lógicas". [1]
En su nivel básico, un documento bien formado requiere que:
Para que un documento esté bien formado, se deben establecer reglas sobre la declaración y el tratamiento de las entidades. Las etiquetas distinguen entre mayúsculas y minúsculas y los atributos se delimitan con comillas. Los elementos vacíos tienen reglas establecidas. Las etiquetas superpuestas invalidan un documento. Lo ideal es que un documento bien formado se ajuste a los objetivos de diseño de XML. Otras reglas de sintaxis clave proporcionadas en la especificación incluyen:
<
y &
aparecen excepto cuando cumplen su función de delimitación de marcado.!"#$%&'()*+,/;<=>?@[\]^`{|}~
, ni un espacio, y no pueden comenzar con -
, .
o un dígito numérico.Un documento XML válido se define en la especificación XML como un documento XML bien formado que también cumple con las reglas de una definición de tipo de documento (DTD). Según el tutorial de XML de JavaCommerce.com, "Los documentos XML bien formados simplemente marcan las páginas con etiquetas descriptivas. No es necesario describir ni explicar lo que significan estas etiquetas. En otras palabras, un documento XML bien formado no necesita una DTD, pero debe cumplir con las reglas de sintaxis XML. Si todas las etiquetas de un documento están formadas correctamente y siguen las pautas de XML, entonces se considera que un documento está bien formado". [2] [3]
Un procesador XML que detecta una violación de las reglas de formato correcto debe informar de dichos errores y detener el procesamiento normal. Esta política, a veces denominada draconiana , [4] contrasta notablemente con el comportamiento de los programas que procesan HTML , que están diseñados para producir un resultado razonable incluso en presencia de graves errores de marcado [5] en el espíritu de la ley de Postel ("Sea conservador en lo que envía; sea liberal en lo que acepta"). [6] [4]
El concepto de un documento bien formado permite una mejor comprensión de la construcción fundamental de XML. Ayuda a aclarar XML más allá de su sentido típico. Por ejemplo, si bien la mayoría de las definiciones de tipos de documentos XML utilizan corchetes angulares izquierdo y derecho como delimitadores de contenido, estrictamente hablando esto no es una necesidad (aunque un delimitador debe ser breve y conciso). Los códigos de corchetes angulares izquierdo y derecho son una convención, aunque claros y distintivos, no un requisito absoluto.
El concepto de documento bien formado también permite comprender la naturaleza abstracta de XML. En realidad, no existe tal cosa como XML. [ cita requerida ] Más bien, XML es un principio que representa un conjunto de comportamientos y prácticas. Es posible analizar los tipos de XML, tal como se expresan en una definición de tipo de documento (DTD).
Los documentos bien formados también ponen de relieve la cuestión de XML válido frente a XML correcto. Según la Organización W3, los documentos válidos son aquellos que se validan con una DTD. Las reglas de validez significan que un documento cumple con las restricciones establecidas en una DTD. Por lo tanto, las etiquetas o entidades deben cumplir con las reglas y relaciones establecidas en una DTD. Sin embargo, no existe ningún control sobre si una etiqueta o entidad es correcta. Por lo tanto, una etiqueta de encabezado de primer nivel podría aplicarse a un objeto de encabezado de segundo nivel y ser válida, aunque incorrecta.
El énfasis en los documentos bien formados se ha desarrollado dentro de la industria editorial , donde el uso de información delimitada por corchetes angulares izquierdo y derecho se ha vuelto problemático. [ cita requerida ] El énfasis en el documento bien formado permite que la definición, delimitación y anidación de contenido se gestione dentro de programas que no son XML, per se, pero que exhiben las características o el potencial para estar bien formados.
Hay varias herramientas disponibles para determinar si un documento XML determinado está bien formado.