MHTML , una inicial de " encapsulación MIME de documentos HTML agregados ", es un formato de archivo web utilizado para combinar, en un solo archivo de computadora , el código HTML y sus recursos complementarios (como imágenes) que están representados por hipervínculos externos en el código HTML de la página web. El contenido de un archivo MHTML se codifica utilizando las mismas técnicas que se desarrollaron por primera vez para los mensajes de correo electrónico HTML , utilizando el tipo de contenido MIME multipart/related
. [1] Los archivos MHTML utilizan una extensión de nombre de archivo .mhtml o .mht .
La primera parte del archivo es el encabezado de un correo electrónico . La segunda parte suele ser código HTML. Las partes posteriores son recursos adicionales identificados por sus localizadores uniformes de recursos (URL) originales y codificados en codificación binaria a texto base64 . MHTML se propuso como estándar abierto y luego circuló en una edición revisada en 1999 como RFC 2557.
Las extensiones de nombre de archivo .mhtml (archivo web) y .eml (correo electrónico) son intercambiables: cualquiera de las extensiones de nombre de archivo se puede cambiar de una a otra. Un mensaje .eml se puede enviar por correo electrónico y un cliente de correo electrónico puede mostrarlo . Un mensaje de correo electrónico se puede guardar usando una extensión de nombre de archivo .mhtml o .mht y luego abrirlo para mostrarlo en un navegador web o para editar otros programas, incluidos procesadores y editores de texto .
El encabezado de un archivo MHTML contiene metadatos como una marca de fecha y hora , título de la página, la URL de origen y una cadena límite aleatoria única para separar los recursos contenidos en el archivo. La cadena de límite se define al principio y se utiliza en todo el archivo.
De: <Guardado por Blink> Ubicación-contenido-instantánea: https:// en.wikipedia.org /wiki/MHTML/Smartphone Asunto: Smartphone - Wikipedia Fecha: sábado, 24 de septiembre de 2022 00:34:32 -0000 Versión MIME: 1.0 Tipo de contenido: multiparte / relacionado ;tipo = "texto/html" ;límite = "----MultipartBoundary--GsIBda0vjy2AKIALiwl7JMwezXDRjDAsLje9khd5l----"
Luego, los recursos de la página se contienen secuencialmente, comenzando con el código fuente HTML renderizado de la página. Cada recurso tiene su propio encabezado de metadatos que especifica su tipo MIME y la ubicación original.
------MultipartBoundary--GsIBda0vjy2AKIAIliwl7JMwezXDRjDAsLje9khd5l---- Tipo de contenido: texto / html ID de contenido: <[email protected]> Codificación de transferencia de contenido: binario Ubicación de contenido: https:// en .wikipedia.org /wiki/MHTML/Smartphone <!DOCTYPE html>
El archivo MHTML termina con una cadena de límite que no va seguida de ningún dato. [2]
Algunos navegadores admiten el formato MHTML, ya sea directamente o mediante extensiones de terceros, pero el proceso para guardar una página web junto con sus recursos como un archivo MHTML no está estandarizado. Debido a esto, una página web guardada como un archivo MHTML usando un navegador puede mostrarse de manera diferente en otro.
A partir de la versión 5.0, IE fue el primer navegador que admitía la lectura y el almacenamiento de páginas web y recursos externos en un único archivo MHTML.
A partir de cambiar al código fuente de Chromium , Edge admite guardar como MHTML.
La compatibilidad para guardar páginas web como archivos MHTML estuvo disponible en el navegador web Opera 9.0. [3] Desde Opera 9.50 hasta el resto de la línea de productos Opera basada en Presto (actualmente en Opera 12.16 a partir del 19 de julio de 2013), el formato predeterminado para guardar páginas es MHTML. La versión inicial del nuevo Opera basado en Webkit/Blink (Opera 15) no era compatible con MHTML, pero las versiones posteriores (Opera 16 en adelante) sí lo hacen.
MHTML se puede habilitar escribiendo "opera://flags#save-page-as-mhtml" en la barra de direcciones.
La creación de archivos MHTML en Google Chrome está habilitada de forma predeterminada en la versión 86.
La creación de archivos MHTML (varias partes/relacionados) en el navegador Yandex está habilitada de forma predeterminada en la versión 22.7.4.960 (julio de 2022).
De manera similar a Google Chrome, el navegador Vivaldi basado en Chromium puede guardar páginas web como archivos MHTML desde la versión 2.3. [4]
Admite la lectura y escritura de archivos MHTML alternando la opción "vivaldi://flags/#save-page-as-mhtml".
Mozilla Firefox no es compatible con MHTML. [5] Hasta la llegada de la versión 57 ("Firefox Quantum") , los archivos MHT se podían leer y escribir instalando una extensión del navegador , como Mozilla Archive Format o UnMHT.
A partir de la versión 3.1.1, el navegador web Safari de Apple Inc. no admite de forma nativa el formato MHTML. En cambio, Safari admite el formato de archivo web y la versión macOS incluye una función de impresión a PDF .
Como ocurre con la mayoría de los navegadores web modernos, se puede agregar compatibilidad con archivos MHTML a Safari a través de varias extensiones de terceros.
A partir de la versión 3.5.7, el navegador web Konqueror de KDE no admite archivos MHTML. Se puede utilizar un proyecto de extensión, mhtconv, para permitir guardar y ver archivos MHTML.
NetFront 3.4 (en dispositivos como el Sony Ericsson K850 ) puede ver y guardar archivos MHTML.
Pale Moon requiere la instalación de una extensión para leer y escribir archivos MHT. Una extensión está disponible gratuitamente, MozArchiver, una bifurcación de la extensión Mozilla Archive Format.
GNOME Web agregó soporte para leer y guardar páginas web en MHTML desde la versión 3.14.1 lanzada en septiembre de 2014. [6]
Existen productos de software comerciales para ver archivos MHTML y convertirlos a otros formatos, como PDF y ePub . Algunos programas de edición de HTML pueden ver y editar archivos MHTML.
El tipo MIME para MHTML no está bien acordado. Los tipos MIME utilizados incluyen:
Problem Steps Recorder para Windows puede guardar su salida en formato MHT.
La extensión "Guardar en Google Drive" para Google Chrome puede guardar como MHTML como una de sus salidas.
Microsoft OneNote , a partir de OneNote 2010, envía por correo electrónico páginas individuales como archivos .mht.
Evernote para Windows puede exportar notas en formato MHT, como alternativa a HTML o su propio formato nativo .enex.
En mayo de 2015, un investigador señaló que los atacantes podrían crear documentos maliciosos creando un archivo MHT, agregando un objeto MSO al final (MSO es un formato de archivo utilizado por la aplicación de correo electrónico Microsoft Outlook ) y cambiando el nombre del archivo resultante con un Extensión .doc. [7] El método de envío sería mediante correos electrónicos spam. [8]
En abril de 2019, un investigador de seguridad publicó detalles sobre una vulnerabilidad de entidad externa XML (XXE) que podría explotarse cuando un usuario abre un archivo MHT. Dado que el sistema operativo Windows está configurado para abrir automáticamente todos los archivos MHT, de forma predeterminada, en Internet Explorer, el exploit podría activarse cuando un usuario haga doble clic en un archivo que recibió por correo electrónico, mensajería instantánea u otro vector, incluido un navegador diferente. [9]
El esquema de URI de datos ofrece una alternativa para incluir elementos separados como imágenes, hojas de estilo y scripts en línea al atender una solicitud HTML o guardar un recurso HTML para su uso sin conexión. Al igual que el contenido incrustado en MHTML, los URI de datos utilizan la codificación Base64 de los recursos externos (que pueden ser binarios o de texto) para incrustarlos en línea dentro del marcado HTML. Las páginas HTML guardadas con elementos externos incrustados utilizando el esquema URI de datos son páginas web estándar y pueden abrirse con cualquier navegador moderno, incluidos los navegadores que no admiten MHTML, como Mozilla Firefox. [10] A diferencia de MHTML, guardar páginas web con sus recursos externos integrados utilizando URI de datos requiere la instalación de una extensión de terceros en el navegador. [11]
El formato de archivo Mozilla (MAFF) es un formato de archivo web heredado que fue compatible con Firefox de 2004 a 2018 a través de un complemento. [12] A diferencia de MHTML y URI de datos, MAFF utiliza un contenedor ZIP para preservar tanto el archivo HTML como sus elementos externos. En octubre de 2017, el desarrollador del complemento anunció que el formato ya no sería compatible con versiones futuras de Firefox. [13]
{{cite web}}
: CS1 maint: numeric names: authors list (link)