您现在的位置:首页 >> IT >> 正文
Wayback Machine收录网页索引超4000亿条
发表时间:2014年5月12日 07:03 来源:腾讯网 责任编辑:编 辑:麒麟

Wayback Machine收录网页索引超4000亿条

腾讯科技讯 5月12日消息,据科技网站TheNextWeb报道,The Internet Archive达成了一项重大的里程碑,从1996年末至今年5月9日,其网站历史信息查询服务工具“网站时光倒流机器(Wayback Machine)”已收录4000亿条被索引网页,涵盖几乎所有网站的网页历史记录。

为了庆祝这一里程碑的胜利,the Internet Archive总结了网站时光倒流机器这些年来的主要成就:

2001年:网站时光倒流机器启动。

2006年:网页存档服务Archive-It上线,允许订阅该服务的函数库创建网页内容收藏。

2009年3月25日:The Internet Archive和太阳微系统公司(Sun Microsystems)共同推出全新数据中心,用于存储全部网页档案,并为网站时光倒流机器提供服务。这个存储量为3PB(petabyte,千万亿字节)的数据中心每秒要处理500条请求。

2011年6月15日:HTTP Archive加入the Internet Archive,为后者网页内容的收集添加网站表现性能相关数据。

2012年5月28日:在被封锁数年后,网站时光倒流机器再次登陆中国。

2012年10月26日:the Internet Archive将2011年起抓取到的80TB网页数据,向研究者开放,以研究其他人与内容互动的方式以及如何从内容中获取信息。

2013年10月:网站时光倒流机器新功能上线,其中包括方便任何人应需进行叶面存档的“保存”页面功能;一小时内可查看最新的已存档抓取内容功能;并对从维基百科和WordPress.com中引入的断链进行了修复。

2013年10月:在美国联邦政府关闭期间,可通过网站时光倒流机器访问部分早关停的重要联邦政府网站。(瑾瑜)

关于我们 | 联系我们 | 友情链接
新科技网络【京ICP备14006744号】
Copyright © 2014 Hnetn.com, All Right Reserved
版权所有 新科技网络
本站郑重声明:本站所载文章、数据仅供参考,使用前请核实,风险自负。