Wayback Machine

Wayback Machine

一个免费的网页历史存档和查询工具,可以能保存不同时间点的网页内容,即使原始网页被删除或修改,也能查看过去的网页快照。它是目前全球最大的网页历史数据库。

#行业圈子 #教育学习
收藏

Wayback Machine简介

Wayback Machine 是互联网档案馆(Internet Archive)旗下最知名的服务,一个免费的网页历史存档和查询工具。互联网档案馆成立于 1996 年,是一个非营利性的线上图书馆,收录了数百万本免费书籍、视频、软件、音乐和网站等内容。Wayback Machine 能保存不同时间点的网页内容,即使原始网页被删除或修改,也能查看过去的网页快照。它是目前全球最大的网页历史数据库,每天处理超过 10 亿次访问和存档请求,已保存超过 6890 亿个网页快照。

Wayback Machine:一个免费的网页历史存档和查询工具

功能特点

  • 保存网页:用户可以提交网址进行存档。注册免费账户后,还能请求抓取页面的外部链接,并收到抓取报告。Wayback Machine 提供适用于 Safari、Firefox、Chrome 的浏览器扩展,以及 iOS 和 Android 应用,方便用户随时保存网页。如果同时拥有 Internet Archive 和 Google 账号,还可以使用批量保存功能:将网址填入 Google 表格的 A 列,系统会自动在 B 列和 D 列显示存档状态和链接,处理开始和结束时会发送邮件通知。

  • 查看存档版本:输入网址后,系统会显示“年份选择器”和“日期选择器”,列出所有存档记录。用户可以选择年份和具体日期查看网页快照。日历中用圆圈标记有存档的日期,圆圈越大表示存档次数越多。不同颜色代表不同状态:蓝色表示存档正常,绿色表示有重定向,橙色表示链接异常,红色表示服务器错误。鼠标悬停在具体日期上,可查看当天的多次存档记录(精确到时分秒),点击即可访问。

  • 比较存档版本:使用“查阅改动”功能,输入已存档的网址,选择两个时间点,可以并排查看网页的变化。系统用不同颜色标注内容变动:黄色表示删除的内容,蓝色表示新增的内容。

  • 了解信息背景:存档页面有时会附带背景说明,帮助用户理解内容。例如,网页被删除或被知名机构引用时,会提供相关解释或上下文信息。

Wayback Machine使用方式

搜索方式主要有两种:一是通过网页链接(URL)直接查找;二是通过关键词进行搜索。实际使用中,URL 搜索更为常见。每次存档都会生成一个 16 位时间码,记录具体的年月日时分秒。存档页面中的链接默认跳转到 Wayback Machine 中的其他存档页面,而非原始网页。

Wayback Machine应用

浏览器插件

支持 Chrome、Firefox、Safari 等浏览器。安装后,用户可以一键保存当前页面、查看页面历史、打开最早快照等。插件还能自动检测 404 错误,并尝试通过存档恢复页面。以 Chrome 为例,用户可通过扩展管理器安装插件,安装后可查看页面上次存档时间,并使用相关功能。

移动应用

提供 iOS 和 Android 应用,方便用户在手机上使用。

应用场景

  • 记者、研究人员、事实核查人员可用其追踪网站历史、验证信息;

  • 普通用户可用来回顾旧版网站;

  • 网站所有者可查看网站演变过程;

  • SEO 人员可分析页面变动、检查网页状态。

注意事项

  • 主要依赖 URL 搜索,关键词搜索使用较少;

  • 存档页面中的链接默认跳转到其他存档页面;

  • 通常不保存网页中的视频内容。

到头啦!

与Wayback Machine相关工具