Los microformatos ( μF ) [nota 1] son un conjunto de clases HTML definidas creadas para servir como metadatos consistentes y descriptivos sobre un elemento , designándolo como representativo de un cierto tipo de datos (como información de contacto , coordenadas geográficas , eventos, publicaciones de blog, productos, recetas, etc.). [1] Permiten que el software procese la información de manera confiable al hacer que las clases establecidas se refieran a un tipo específico de datos en lugar de ser arbitrarias.
Los microformatos surgieron alrededor de 2005 y fueron diseñados predominantemente para su uso en motores de búsqueda, distribución web y agregadores como RSS . [2] Google confirmó en 2020 que todavía analiza microformatos para su uso en la indexación de contenidos. [3] Se hace referencia a los microformatos en varias especificaciones web sociales del W3C, incluidas IndieAuth [4] y Webmention. [5]
Aunque el contenido de las páginas web ha sido capaz de cierto "procesamiento automatizado" desde el inicio de la web, dicho procesamiento es difícil porque los elementos de marcado utilizados para mostrar información en la web no describen lo que significa la información. [6] Los microformatos pueden cerrar esta brecha al agregar semántica y, por lo tanto, obviar otros métodos más complicados de procesamiento automatizado, como el procesamiento del lenguaje natural o el screen scraping . El uso, la adopción y el procesamiento de microformatos permiten indexar, buscar, guardar o hacer referencias cruzadas a elementos de datos, de modo que la información pueda reutilizarse o combinarse. [6]
A partir de 2013 [update], los microformatos permiten codificar y extraer detalles de eventos, información de contacto, relaciones sociales e información similar.
Microformats2, abreviado como mf2, es la versión actualizada de microformats. Mf2 proporciona una forma más sencilla de interpretar la sintaxis y los vocabularios estructurados de HTML que las formas anteriores que utilizaban RDFa y microdatos. [7]
Los microformatos surgieron alrededor de 2005 [nota 2] como parte de un movimiento popular para hacer que los elementos de datos reconocibles (como eventos, detalles de contacto o ubicaciones geográficas) pudieran ser procesados automatizadamente por software, así como directamente legibles por los usuarios finales. [6] [nota 3] Los microformatos basados en enlaces surgieron primero. Estos incluyen enlaces de votación que expresan opiniones sobre la página vinculada, que los motores de búsqueda pueden contar en encuestas instantáneas. [8]
CommerceNet , una organización sin fines de lucro que promueve el comercio electrónico en Internet, ha ayudado a patrocinar y promover la tecnología y apoyar a la comunidad de microformatos de varias maneras. [8] CommerceNet también ayudó a cofundar el sitio comunitario Microformats.org. [8]
Ni CommerceNet ni Microformats.org operan como organismos de normalización . La comunidad de microformatos funciona a través de una wiki abierta , una lista de correo y un canal de chat de retransmisión por Internet ( IRC ). [8] La mayoría de los microformatos existentes se originaron en la wiki de Microformats.org y la lista de correo asociada [ cita necesaria ] mediante un proceso de recopilación de ejemplos de comportamiento de publicación web y luego su codificación. Se han propuesto o desarrollado algunos otros microformatos (como rel=nofollow y unAPI ) en otros lugares.
Los estándares XHTML y HTML permiten la incorporación y codificación de semántica dentro de los atributos de los elementos de marcado . Los microformatos aprovechan estos estándares al indicar la presencia de metadatos utilizando los siguientes atributos:
class
rel
<a href=... rel=...>...</a>
)rev
Por ejemplo, en el texto "Los pájaros posaron en 52,48 , -1,89 " hay un par de números que pueden entenderse, por su contexto, como un conjunto de coordenadas geográficas . Con ajuste en intervalos (u otros elementos HTML) con nombres de clases específicos (en este caso geo
, latitude
y longitude
, todos forman parte de la especificación del microformato geográfico ):
Los pájaros se posaron en <span class= "geo" > <span class= "latitud" > 52,48 </span> , <span class= "longitude" > -1,89 </span> </span>
Los agentes de software pueden reconocer exactamente qué representa cada valor y luego pueden realizar una variedad de tareas como indexar, ubicarlo en un mapa y exportarlo a un dispositivo GPS .
En este ejemplo, la información de contacto se presenta de la siguiente manera:
<ul> <li> Joe Doe </li> <li> La empresa de ejemplo </li> <li> 604-555-1234 </li> <li><a href= "http://example.com/ " > http://ejemplo.com/ </a></li> </ul>
Con el marcado de microformato hCard, eso se convierte en:
<ul class= "vcard" > <li class= "fn" > Joe Doe </li> <li class= "org" > La empresa de ejemplo </li> <li class= "tel" > 604-555-1234 </li> <li> <a class= "url" href= "http://example.com/" > http://example.com/ </a></li> </ul>
Aquí, el nombre formateado ( fn
), la organización ( org
), el número de teléfono ( tel
) y la dirección web ( url
) se han identificado utilizando nombres de clases específicos y todo está envuelto en class="vcard"
, lo que indica que las otras clases forman una hCard (abreviatura de "HTML vCard ") y no se nombran simplemente por coincidencia. También existen otras clases hCard opcionales. El software, como los complementos del navegador, ahora puede extraer la información y transferirla a otras aplicaciones, como una libreta de direcciones.
Se han desarrollado varios microformatos para permitir el marcado semántico de tipos particulares de información. Sin embargo, sólo se han ratificado hCard y hCalendar, los demás permanecen como borradores:
El uso de microformatos dentro del código HTML proporciona formato adicional y datos semánticos que las aplicaciones pueden usar. Por ejemplo, aplicaciones como los rastreadores web pueden recopilar datos sobre recursos en línea, o aplicaciones de escritorio como clientes de correo electrónico o software de programación pueden recopilar detalles. El uso de microformatos también puede facilitar "combinaciones", como exportar todas las ubicaciones geográficas de una página web a (por ejemplo) Google Maps para visualizarlas espacialmente.
Varias extensiones de navegador, como Operador para Firefox y Oomph para Internet Explorer , brindan la capacidad de detectar microformatos dentro de un documento HTML. Cuando se trata de hCard o hCalendar, dichas extensiones de navegador permiten exportar microformatos a formatos compatibles con la gestión de contactos y las utilidades de calendario, como Microsoft Outlook . Al tratarse de coordenadas geográficas, permiten enviar la ubicación a aplicaciones como Google Maps . Yahoo! El lenguaje de consulta se puede utilizar para extraer microformatos de páginas web. [16] El 12 de mayo de 2009, Google anunció que analizaría los microformatos hCard, hReview y hProduct y los utilizaría para completar las páginas de resultados de búsqueda. [17] Posteriormente ampliaron esto en 2010 para usar hCalendar para eventos y hRecipe para recetas de cocina. [18] Del mismo modo, los microformatos también son procesados por Bing [19] y Yahoo! . [20] A finales de 2010, estos son los tres principales motores de búsqueda del mundo. [21]
Microsoft dijo en 2006 que necesitaban incorporar microformatos en sus próximos proyectos, [22] al igual que otras empresas de software.
Alex Faaborg resume los argumentos para dejar la responsabilidad de las interfaces de usuario de microformato en el navegador web en lugar de hacer HTML más complicado: [23]
Varios comentaristas han ofrecido reseñas y debates sobre los principios de diseño y los aspectos prácticos de los microformatos. Los microformatos se han comparado con otros enfoques que buscan cumplir el mismo propósito o uno similar. [24] A partir de 2007 [update], ha habido algunas críticas a uno o todos los microformatos. [24] A partir de 2007 se propugnó la difusión y el uso de microformatos [update]. [25] [26] El CTO de Opera Software y creador de CSS , Håkon Wium Lie , dijo en 2005: "También veremos el desarrollo de un montón de microformatos, y creo que así es como se construirá la web semántica ". [27] Sin embargo, en agosto de 2008 Toby Inkster, autor del servicio de análisis de microformato "Swignition" (anteriormente "Cognition"), señaló que no se habían publicado nuevas especificaciones de microformato desde 2005. [28]
El científico informático y empresario Rohit Khare afirmó que reducir, reutilizar y reciclar es "una abreviatura de varios principios de diseño" que motivaron el desarrollo y las prácticas detrás de los microformatos. [8] : 71–72 Estos aspectos se pueden resumir de la siguiente manera:
Debido a que algunos microformatos utilizan el atributo de título del <abbr>
elemento HTML para ocultar datos legibles por máquina (particularmente fechas, horas y coordenadas geográficas) en el "patrón de diseño abbr", el contenido de texto plano del elemento es inaccesible para los lectores de pantalla que expanden las abreviaturas. [29] En junio de 2008, la BBC anunció que abandonaría el uso de microformatos utilizando el abbr
patrón de diseño debido a problemas de accesibilidad. [30]
Los microformatos no son la única solución para proporcionar "datos más inteligentes" en la web; Se utilizan enfoques alternativos que están en desarrollo. Por ejemplo, se citan como enfoques alternativos el uso de marcado XML y estándares de la Web Semántica. [8] Algunos los contrastan con los microformatos en el sentido de que no necesariamente coinciden con los principios de diseño de "reducir, reutilizar y reciclar", al menos no en la misma medida. [8]
Un defensor de los microformatos, Tantek Çelik , caracterizó un problema con enfoques alternativos:
Aquí hay un nuevo idioma que queremos que aprenda y ahora necesita generar estos archivos adicionales en su servidor. Es una molestia. (Microformatos) bajan la barrera de entrada. [6]
Para algunas aplicaciones, el uso de otros enfoques puede ser válido. Si el tipo de datos que se van a describir no se corresponde con un microformato existente, RDFa puede incrustar vocabularios arbitrarios en HTML, como por ejemplo datos científicos de un dominio específico, como datos zoológicos o químicos para los que no existe un microformato. Estándares como el GRDDL del W3C permiten convertir microformatos en datos compatibles con la Web Semántica. [31]
Otro defensor de los microformatos, Ryan King, expresó la compatibilidad de los microformatos con otros enfoques de esta manera:
Los microformatos proporcionan una manera fácil para que muchas personas aporten datos semánticos a la web. Con GRDDL, todos esos datos están disponibles para las herramientas de Web Semántica RDF. Los microformatos y GRDDL pueden trabajar juntos para construir una mejor web. [31]
Microformats2 fue propuesto y discutido durante FOOEast, 2010-05-02. [32] Microformats2 tenía como objetivo facilitar a los autores la publicación de microformatos y a los desarrolladores su consumo, sin dejar de ser compatible con versiones anteriores [33]
Usando microformatos2, el ejemplo anterior se marcaría como:
Los pájaros se posaron en <span class= "h-geo geo" > <span class= "p-latitude latitude" > 52,48 </span> , <span class= "p-longitude longitude" > -1,89 </span> < /lapso>
y:
<ul class= "h-card vcard" > <li class= "p-name fn" > Joe Doe </li> <li class= "p-org org" > La empresa de ejemplo </li> <li class= "p-tel tel" > 604-555-1234 </li> <li> <a class= "u-url url" href= "http://example.com/" > http://example.com/ </a></li> </ul>
Necesitamos microformatos y conseguir que la gente se ponga de acuerdo sobre ellos.
Va a iniciar el intercambio de datos en la Web... ...los necesitamos para cosas como tarjetas de contacto, eventos, direcciones...