MHTML
网页封存盘(英语:或,缩写mhtml)是种保存文件格式,在RFC 2110中定义,后经RFC 2557修订。微软称之单一文件网页或单个文档网页(Single-File Web Page)[1][2][3]。
![]() IE使用的图标 | |
.mht, .mhtml | |
multipart/related application/x-mimearchive | |
格式类型 | 置标语言 |
自 | HTML |
标准 | RFC 2557(1999年推荐) |
其以多用途互联网邮件扩展格式,应用HTML邮件消息相同技术开发,将一个多附件网页(如包含大量图片、Flash动画、Java小进程的网页)保存成单一文件[4],扩展名为.mht(IE)或.mhtml(Chromium),支持浏览器对此两种扩展名皆可设置读取。由于IE最早使用,有时被简称MHT。
与HTML差异
HTML页面中的图形和其他功能可以分开存放,需要原始文档上引用,也可以通过data URI scheme等途径嵌入其中。MHTML则把网页及其附件皆保存为单一文件。
创建及编辑
Microsoft Office(Word[4]、Excel、PowerPoint、Access)能够创建及编辑MHTML文件。
在Linux平台上,程序kmhtConvert可将文档转换为MHTML格式。
浏览器的支持
有些浏览器具有原生的这种把网页保存为MHTML的方式,而有些浏览器可直接通过第三方的扩展支持MHTML格式。由于保存为MHTML的方式未经标准化,因此各浏览器读取的效果略有不同。
Internet Explorer
Microsoft Internet Explorer自5.0版支持MHTML格式,是第一个支持MHTML文档的浏览器。
Opera
Opera自9.0版支持把网页保存为MHTML文档,或读取MHTML文档。[5]但基于WebKit/Blink的Opera 15却未提供此功能,直到Opera 16才恢复。
现时通过opera://flags#save-page-as-mhtml激活实验性的选项。
Firefox
Firefox不支持读写MHT文档。[6]在57.0之前有两个这样的扩展是免费提供的,如Mozilla Archive Format (页面存档备份,存于)、UnMHT。
Google Chrome
在Chrome 86版中,创建MHTML文档的功能已默认启用。
ACCESS NetFront
NetFront 3.4(像是索尼爱立信K850等设备上的)可读取或保存MHTML文档。
Pale Moon
Pale Moon需要安装MHT文档读写的扩展。有一个这样的扩展是免费提供的,即MozArchiver (页面存档备份,存于)。
GNOME Web
最近的GNOME Web版本可以访问MHTML。
Vivaldi
Vivaldi可以通过vivaldi://flags#save-page-as-mhtml激活实验性的选项。
MHT阅读器
一些商业或民间开发者设计了MHT文档阅读器,还提供转换为其它格式(如转换为PDF)的选项。
格式
MHTML文件的第一部分是电子邮件档头,第二部分是常规的HTML源码,后续部分是由各自的URL标识的附件,并以base64格式编码。
该文件与 .eml(电子邮件)具有互换性,二者的扩展名可以相互交换。一份 .eml 文件可以作为电子邮件发送,也可以通过电邮客户端显示,一条电邮信息可以用 .mhtml 或 .mht 扩展名存储,并通过一些网页浏览器或者文本编辑器显示。
示例如下:
Subject:标题
Date: Wed, 15 Dec 2004 10:05:01 +1000
Content-Type: multipart/related;
Content-Transfer-Encoding: quoted-printable
Content-Location: file://C:/fishier.html
This is a multi-part message in MIME format.
Content-Type: text/html;
<HTML>
<HEAD>
<TITLE>Title</TITLE>
</HEAD>
<BODY>
...
</BODY>
</HTML>
Content-Type: image/gif
Content-Transfer-Encoding: base64
Content-Location: file://C:/image.gif
RHLJbDYX0KhHzv7yGcCgghhgHLJbDYX0KhHzv7yGcChkNdjn+Nfn+NXm98/i98rf9sfe9b/Z9L3X
87fU8qP8afL8AHzvfg7yGcChkNIwMZHLJbDYX0KhHzv37yGcChkNIw2Oj5AAAZIAlhAAACwAAAAA
er8JhHg8PhgQBrPZwG673+6CoUCv2+91gn5PGPT7fgOCg4SFhQKIiYoCAY2Oj5AAAZIAlJWXACEA
4SFh==
其中Subject为文档标题,Content-Type为文档的MIME属性,Content-Location为原始文档的地址,Content-Transfer-Encoding为编码格式。
参见
- Mozilla Archive Format
- Webarchive
- RFC 2397
参考数据
- . Microsoft Docs. 2020-06-12. (原始内容存档于2020-06-21) (英语).
- . Microsoft Docs. 2020-06-13. (原始内容存档于2020-06-21) (中文(台湾)).
- . Microsoft Docs. 2020-06-13. (原始内容存档于2020-06-19) (中文(中国大陆)).
- David J. Clark. . John Wiley & Sons. 2008. ISBN 9780470377437.
- Santambrogio, Claudio. . Opera Software. 10 March 2006 [2009-05-15]. (原始内容存档于2006-03-21).
- . [2018-10-23]. (原始内容存档于2020-12-15).