stringtranslate.com

HTML semántico

Categorías de contenido de elementos HTML

El HTML semántico es el uso del marcado HTML para reforzar la semántica , o el significado, de la información en páginas web y aplicaciones web, en lugar de simplemente definir su presentación o apariencia . El HTML semántico es procesado por navegadores web tradicionales , así como por muchos otros agentes de usuario . Se utiliza CSS para sugerir cómo se presenta a los usuarios humanos.

Historia

HTML ha incluido el marcado semántico desde sus inicios. [1] En un documento HTML, el autor puede, entre otras cosas, "comenzar con un título; agregar encabezados y párrafos; agregar énfasis al texto; agregar imágenes; agregar enlaces a otras páginas; [y] usar varios tipos de listas". [2]

Varias versiones del estándar HTML han incluido marcado de presentación como <font>(añadido en HTML 3.2; eliminado en HTML 4.0 Strict), <i>(todas las versiones) y <center>(añadido en HTML 3.2). También están los elementos span y div , semánticamente neutrales . Desde finales de los años 90, cuando las hojas de estilo en cascada comenzaron a funcionar en la mayoría de los navegadores, se ha alentado a los autores web a evitar el uso de marcado HTML de presentación con vistas a la separación del contenido y la presentación . [3]

En 2001, Tim Berners-Lee participó en un debate sobre la Web semántica , en el que se planteó que algún día los "agentes" de software inteligentes podrían rastrear automáticamente la Web y encontrar, filtrar y correlacionar datos publicados que no estaban relacionados previamente para el beneficio de los usuarios finales. [4] Dichos agentes no son comunes ni siquiera ahora, pero algunas de las ideas de la Web 2.0 , los mashups y los sitios web de comparación de precios pueden estar acercándose. La principal diferencia entre estos híbridos de aplicaciones web y los agentes semánticos de Berners-Lee radica en el hecho de que la agregación e hibridación actual de la información suele estar diseñada por desarrolladores web, que ya conocen las ubicaciones web y la semántica API de los datos específicos que desean combinar.

Un tipo importante de agente web que rastrea y lee páginas web automáticamente, sin conocimiento previo de lo que puede encontrar, es el rastreador web o araña de motor de búsqueda. Estos agentes de software dependen de la claridad semántica de las páginas web que encuentran, ya que utilizan diversas técnicas y algoritmos para leer e indexar millones de páginas web al día y brindarles a los usuarios de la web funciones de búsqueda .

Para que las arañas de los motores de búsqueda puedan evaluar la importancia de los fragmentos de texto que encuentran en los documentos HTML, y también para aquellos que crean mashups y otros híbridos, así como para los agentes más automatizados a medida que se desarrollan, las estructuras semánticas que existen en HTML deben aplicarse de manera amplia y uniforme para resaltar el significado de la información publicada. [5]

Aunque la verdadera web semántica puede depender de ontologías RDF y metadatos complejos , cada documento HTML hace su contribución a la significatividad de la Web mediante el uso correcto de encabezados, listas, títulos y otro marcado semántico siempre que sea posible. Este uso "simple" de HTML se ha denominado "HTML semántico simple" o POSH. [6] El uso correcto del "etiquetado" de la Web 2.0 crea folksonomías que pueden ser igualmente o incluso más significativas para muchos. [5] HTML 5 introdujo nuevos elementos semánticos como , , , , , , , y . [7] En general, el objetivo del W3C es introducir lentamente más formas para que los navegadores, desarrolladores y rastreadores distingan mejor entre diferentes tipos de datos, lo que permite obtener beneficios como una mejor visualización en los navegadores de diferentes dispositivos. <section><article><footer><progress><nav><aside><mark><time>

Los elementos de presentación no fueron formalmente desaprobados en las recomendaciones de HTML 4.01 y XHTML, pero se recomendó no usarlos. En HTML 5, algunos de esos elementos, como <i>y <b>, todavía se especifican, ya que su significado se ha definido claramente "para que se desmarquen estilísticamente de la prosa normal sin transmitir ninguna importancia adicional". [8] [9]

Consideraciones

En los casos en que un documento requiere una semántica más precisa que la expresada únicamente en HTML, los fragmentos del documento pueden incluirse dentro de elementos spano divcon nombres de clase significativos [10] como <span class="author">y <div class="invoice">. Cuando estos nombres de clase también son un identificador de fragmento dentro de un esquema u ontología, pueden vincularse a un significado más definido. Los microformatos formalizan este enfoque de la semántica en HTML.

Una restricción importante de este enfoque es que el marcado basado en la inclusión de elementos debe cumplir las condiciones de formación correcta. Como estos documentos están estructurados en forma de árbol, esto significa que solo los fragmentos equilibrados de un subárbol pueden marcarse de esta manera. [11] [12] Un medio para marcar cualquier sección arbitraria de HTML requeriría un mecanismo independiente de la estructura de marcado en sí, como XPointer .

Un buen HTML semántico también mejora la accesibilidad de los documentos web (ver también Pautas de Accesibilidad al Contenido Web ). [ cita requerida ] Por ejemplo, cuando un lector de pantalla o un navegador de audio puede determinar correctamente la estructura de un documento, no desperdiciará el tiempo del usuario con discapacidad visual leyendo información repetida o irrelevante cuando se ha marcado correctamente.

Fragmentos enriquecidos de Google

En 2010, Google especificó tres formas de metadatos estructurados que sus sistemas utilizarán para encontrar contenido semántico estructurado dentro de las páginas web. Dicha información, cuando esté relacionada con reseñas, perfiles de personas, listados de empresas y eventos, será utilizada por Google para mejorar el "fragmento", o fragmento corto de texto citado que se muestra cuando la página aparece en los listados de búsqueda. Google especifica que esos datos pueden proporcionarse mediante microdatos , microformatos o RDFa . [13] Los microdatos se especifican dentro de los elementos HTML existentes itemtypey itempropse agregan atributos a ellos; las palabras clave de microformato se agregan dentro de classlos atributos como se explicó anteriormente; y RDFa se basa en rel, typeofy propertyse agregan atributos a los elementos existentes. [14]

Véase también

Referencias

  1. ^ Berners-Lee, Tim ; Fischetti, Mark (2000). Tejiendo la red: el diseño original y el destino final de la World Wide Web por su inventor . San Francisco: Harper. ISBN 978-0062515872.
  2. ^ Raggett, Dave (24 de abril de 2005). "Getting started with HTML" (Introducción al HTML). World Wide Web Consortium . Consultado el 8 de diciembre de 2010 .
  3. ^ Raggett, Dave (8 de abril de 2002). «Añadir un toque de estilo». World Wide Web Consortium . Consultado el 8 de diciembre de 2010 .Este artículo señala que el marcado HTML de presentación puede ser útil cuando se apunta a navegadores "anteriores a Netscape 4.0 e Internet Explorer 4.0 ", ambos lanzados en 1997.
  4. ^ Berners-Lee, Tim; Hendler, James; Lassila, Ora (2001). "La Web semántica". Scientific American . Consultado el 2 de octubre de 2009 .
  5. ^ ab Shadbolt, Nigel; Berners-Lee, Tim; Hall, Wendy (mayo-junio de 2006). "The Semantic Web Revisited" (PDF) . IEEE Intelligent Systems . Consultado el 8 de diciembre de 2010 .
  6. ^ "Plain Old Semantic HTML (POSH)". Wiki de microformatos . Comunidad de microformatos. 20 de abril de 2007 . Consultado el 4 de mayo de 2013 .
  7. ^ Robinson, Mike. "Hablemos de semántica". HTML 5 Doctor . Consultado el 26 de octubre de 2015 .
  8. ^ "HTML5". Consorcio World Wide Web. Sección 4.5.17: El elemento i.
  9. ^ "HTML5". Consorcio World Wide Web. Sección 4.5.18: El elemento b.
  10. ^ Estos nombres de clase son, en el mejor de los casos, sugerentes más que formalmente significativos, a menos que sean compartidos previamente entre el creador y el consumidor del contenido.
  11. ^ "Documentos XML bien formados". Lenguaje de marcado extensible (XML) 1.1 . W3C .
  12. ^ "Conceitos importantes sobre HTML" (en español). Bendev Júnior.
  13. ^ "Fragmentos enriquecidos". Webmaster Central . Consultado el 26 de mayo de 2010 .
  14. ^ "Empresas y organizaciones - Información sobre organizaciones". Webmaster Central . Consultado el 26 de mayo de 2010 .

Enlaces externos