stringtranslate.com

Comparación de analizadores HTML

Los analizadores HTML son programas que permiten el análisis automatizado del lenguaje de marcado de hipertexto (HTML) . Tienen dos propósitos principales:

* Fecha del último lanzamiento (de cambios significativos).
** sanitizar (generar páginas web compatibles con estándares, reducir spam, etc.) y limpiar (eliminar etiquetas de presentación sobrantes, eliminar código XSS, etc.) el código HTML.
*** Actualiza HTML4.X a XHTML o HTML5, convirtiendo etiquetas obsoletas (por ejemplo, CENTER) en etiquetas válidas (por ejemplo, DIV con style="text-align:center;").

Referencias

  1. ^ 12.2 Análisis de documentos HTML — Estándar HTML Archivado el 16 de enero de 2013 en Wayback Machine
  2. ^ Versión 5.8.0 de HTML Tidy
  3. ^ ab ¿ Qué es Tidy?
  4. ^ Unidad HTML 3.7.0
  5. ^ Lanzamiento de Beautiful Soup 4.10
  6. ^ jsoup Versión 1.18.1 del analizador HTML de Java