一 : Google 网页快照启用新的域名:googleusercontent.com
查看Google网页快照时偶然发现的。Google对网页快照使用了新的域名:googleusercontent.com,我记得以前是用IP的。查了一下whois,信息如下:
以下为引用的内容: Registrant: DNS Admin Google Inc. 1600 Amphitheatre Parkway Mountain View CA 94043 US +1.6502530000 Fax: +1.6506188571 |
又查了一下alexa,排名很高啊,全球的Alexa Traffic Rank排118名,在美国排11名,说明很多人点网页快照的。
又搜了一下英文资料,发现从四月份有些大城市就开始了可以看到这个链接了,那时很多的快照链接还是IP呢,谷歌的快照链接似乎是从五月份开始改的,不过还是不能看到快照内容。
另外,谷歌快照在中国内地经常打不开,解决办法是,把地址换成https就能浏览。
文章来自:http://guao.cc/HQg
感谢读者china 的爆料。
转载请注明:文章转载自:谷奥——探寻谷歌的奥秘 [http://www.google.org.cn](注:本文由编辑整理)
二 : 网页快照
网页快照,英文名叫WebCache,网页缓存。搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。
网页抓取和存储
搜索引擎就会立即在广阔无垠的因特网上,把包含关键词所有网页一网打尽,呈现在我们的面前。如果您了解了搜索引擎的工作原理,就不会这样认为了。每一张网页上都有很多超链接,链接到另外一些网页上,而这些网页上依然有很多超链接,又可以链接到另外一些网页上,搜索引擎的Spider系统通过这样的方式,将互联网上的大量网页逐步抓取下来 搜索引擎中的老大哥Google,它的名字就来自于数学中的1个几乎不可超越的数:googol,这个数是10的100次方,在它的网页数据库中储存了数十亿张网页,这些网页就是通过以上的方式,由NetSpider系统抓取并保存下来的。所有的这些网页,当在搜索引擎结果中进行展示时,都被称为 网页快照。百度快照示意图
三 : 网页快照停滞不前之思索
注册站长网也已经好长时间了,其中针对自己的建站心得也发过几篇软文和大家一起分享过(一个站长成长的辛酸历程 一切从头再来、浅谈搜索引擎的收录及更新规则、浅谈新站被搜索引擎收录技巧等等),不过这次网站快照不更新,特别是4-5月份以来,经常出现大规模快照不更新现象,现根据本人网站(免费之家 http://www.mfzj.net),浅谈网页快照不前的原因:
1、网站有否作弊:一个网站上线后,网页keywords里面关键词堆砌,也会造成搜索引擎降权,导致网页快照不前,一般情况下关键词占整个网页内容的比例应该在2%-7%比较合适。
2、网站是否频繁改动:本人免费之家资源网网站有一阵子经常更改网页模板,因为一个网站上线后,由于审美疲劳,老认为别人的总比自己好,所以造成近2周首页网站快照不前。
3、服务器运营是否稳定:网站被搜索引擎收录以后,当你在规定时间区间内不停更新内容,会造成搜索引擎也会在规定时间内光顾你的站点收录网页。如果在这个时间区域内出现服务器故障或服务器的ip地址其他网站被搜索引擎k掉,也会造成你的网站受牵连而被降权,网站快照一样也会出现停止不前。
4、网站权重是否太低:当网站被搜索引擎定性为权重比较低,那么引擎蜘蛛也会光顾比较慢,造成网站快照长期不更新,唯一的解决方法就是多发些实用原创类的文章,互换相关网站友情链接,网站权重高了,即使内容没有更新,搜索引擎蜘蛛也会常来,网页快照也天天新。
5、友情链接站点是否被k掉:每个网站为了提高权重,会跟自己相同或相似的站点友情链接,如果这些友情链接的站点中出现被搜索引擎K掉的现象,那么你的站点也会出现快照不前。
结论:不管网页快照更新是否,好好管理维护网站,不断更新原创内容,培养搜索引擎的习惯,慢慢它就会对你网页快照经常更新了,所以说要想成为一个成功的网站,网站内容为“王”,流量为“皇”,只有内容为主,流量为辅才能使你的网站越来越辉煌。
站长网首发,转载请注明出处。
四 : 网页快照新发现 书签
最近老是有怪状,有可能是自己修改了一些地方的缘故吧。每次在修改首页的时候就会等两天快照才更新过来,或许是好事或许是坏事,对于SEO的初学者还是不到理解的。
这个博客站点一直在百度上表现卓越,重来没有发生什么错误,不知道这样说了以后就会出现错误。建博以来收录在百度上的页数一直在上升现在有140的收录了,也没有做大量的更新,也只是每天做有频率的更新。现在的成果就是每天有70到80的独立IP或许算不什么。另一方面在GG上表现就不咋的,一般做优化的都是针对GG下手,因为GG比较实在的搜索引擎参与人为机制比较少。而偏偏我的站点收录的页面一直保持在55左右的数据,很是不解,一直更新却没有上升的趋势。不过对于流量的概念也无所谓GG的收录了。后来出于域名指定于是就用了GG管理员工具中的设置首选域名。今天偶然间site了下在GG上居然出现了222条记录就像猛然间发泄一样。还发现的就是一个网页快照的问题,在快照的下面出现了书签的字样。
关于书签的字眼也知道如何解释在SEO的文章中未看到过,也许是自己孤陋寡闻吧,不免对这个现象有点兴趣,看来SEO还有很多神秘的东西去发现。本文由www.frfry.cn站长供稿。
五 : 网页快照你用好了吗
搜索引擎已成为我们网络生活中的一个重要组成部分,而网页快照不仅使我们能更快地访问到搜索出来的网页,而且当我们遇到搜索出来的网页是一些已经删除的网页(如显示“HTTP 404”错误的网页),或是遇到一些暂时关闭的网站,还可以利用网页快照找到所需要的内容。甚至对于我们检索密码和入口都有意想不到的好处,例如在Google中检索“杂志名+password”的时候,经常有一些页面如果直接点连接,提示“404 Not found”之类的错误信息,这时查看Google快照(Cache)往往就能看到该网页原来的内容,甚至会发现许多密码。
掀起你的盖头来—网页快照的原理
简单地讲,“网页快照”就是搜索引擎在收录网页时,都会做一个备份来保存这个网页的主要文字内容,大多是文本的,这个备份是存在搜索引擎的服务器缓存里的,当我们打开网页快照访问时,实际上访问的就是搜索引擎里的这个缓存。所以当这个网页被删除或连接失效时,用户可以使用网页快照来查看这个网页的主要内容,而且又由于这个快照以文本内容为主,因此访问速度比访问一般网页更快。
提示:怎样使用网页快照?
单击搜索结果页面后面的“网页快照”就可以看见该网页的快照内容,对于随时更新的网站(如新闻网站)来说,快照内容不可能跟得上其更新速度,但是对于其他类型或者已经不存在的网站来说,网页快照却是非常有用的,而且网页快照中还有标题信息说明其存档时间日期,并提醒用户这只是存档资料。
天生我材必有用—网页快照的用途
网页快照的用途主要有四个方面:
1.查看无法打开的网页:当你要访问的网页不存在或链接失效或者打开速度极慢时,你可以通过使用网页快照来访问这个网页;
2.查找文字资料:由于网页快照显示的速度比较快,因此如果你要查找一些更新不是很快的文字,比如技术文档、资料等,可以直接通过网页快照来查看,会节省很多时间;
3.快速定位关键字:关键字会单独在网页快照中显示其他的颜色(如红色或者黄色,见下图),因此通过网页快照可以很快找到网页中关键词的位置;
4.查看网页老版本:有时候搜索到的网页可能已经更新了,而你需要的信息是在原来的网页上,这时可以使用快照。
打不开网页快照的解决方案
1.快照打不开的原因
知道了网页快照的原理,我们常常利用它来查找需要的资料,但是使用网页快照时经常会出现打不开的情况,甚至同一时刻有的用户可以打开,而另一个用户却不能使用,这是什么原因呢?一般是由以下三种原因引起的:
①网页文本下载如果排在图片和一些动态文件后,而这些需要先下载的图片或者动态文件却刚好无法下载,则快照可能无法打开;
②若图片或动态文件下载速度慢,会因为超时而打不开快照;
③有些快照中涉及了不良内容,被ISP(如电信)屏蔽了,所以你看不到。
2.解决思路
对于网页快照打不开的前两个原因,是网页本身设计原因造成的,这里我们主要解决第三种情况。ISP出于安全性考虑经常会屏蔽一些字眼和网址,而Google缓存中的一些正常的内容也因此被ISP过滤掉了,导致无法正常打开网页快照。解决问题的根本思路是突破封锁,而ISP采用的方法一般都是对URL地址进行过滤,所以将URL地址修改成符合Google语法格式就可以避开封锁正常浏览了。
3.解决方案
①巧用插件,简单实用
◆GreenBrower/Maxthon两种浏览器的插件。
将解压后的所有文件复制到C:ProgramGreen Borwerplugin
GoogleCache目录下面,启动Green Browser,单击菜单栏中“工具/扩展工具栏”,选择“设置扩展工具栏”,单击“命令”
后的“...”按钮中选择该插件(见下图),再单击“插入”按钮增加该插件,选中该插件前的复选框。如果需要自动运行此插件,则勾选“工具”菜单的“扩展工具栏”的“自动运行所选插件”。
插件安装完成后,如果设定了自动运行,那么插件将在后台开始自动工作了。如果是设定的手动运行,在需要打开快照的页面上和已经打开失败的快照页面上单击工具栏中的“G”按钮后,打开Google搜索结果页面,单击“网页快照”链接查看即可。有时,我们在刷新页面后,会发现安装的插件没起作用,这时在单击“网页快照”链接前,将鼠标悬停在“网页快照”链接上,看浏览器的状态栏显示的链接地址中是否包含有“search?&q=cache:”,尤其是“&”,如果没有则需要再次手动运行插件。
提示:如果是使用Maxthon浏览器,将文件解压至Maxthon程序目录下的pluginGoogleCache目录,退出并重新启动Maxthon,程序自动提示有新的插件,单击“确认”即可。
特别需要注意的是:在打开的页面快照上面的Google框架中有一个“缓存文本”或“cached
text”,不要单击,否则可能会出现页面加载完毕后链接地址被错误修正,无法显示的情况;或者在页面没有加载完毕前点击或刷新后单击,此时链接地址没有修正,导致IP屏蔽,而无法访问页面快照。
提示:其实Google搜索提供了一个最简单的命令,可以完成快照的搜索。当网址不能打开时,可以在Google首页的搜索框中输入“cache:www.pcdigest.com”,回车后就可以打开该页面的快照了。
◆Firefox浏览器的插件。
工具谱
软件名称:GoogleCache(GreenBrower/Maxthon下用)
软件版本:N/A
授权方式:免费软件
软件大小:2.33KB
下载地址:http://searchsmallbizit.techtarget.com.cn/imagelist/05/08/t4ifn0l2q0oh.rar
下载相关插件,解压后是googlecache.xpi文件。
启动Firefox,单击菜单栏上“工具/扩展”打开扩展窗口,把googlecache.xpi文件用鼠标拖入到扩展窗口中,会自动弹出一个安装对话框(下图),单击“立即安装”,插件即开始安装,然后重启Firefox。 工具谱
软件名称:GoogleCache(Firefox)
软件版本:N/A
授权方式:免费软件
软件大小:2.85KB
下载地址:http://mygoogle.kmip.net/gznm/050901/firefoxcache.rar
在Firefox地址栏输入“about:config”,这时工具栏上会多一个过滤器(英文版是Filter)。在其中输入“search”,网页页面中会自动出现“browser.search.defaulturl”,后面的值是“http://www.google.com/search?lr=...”(见下图),右键单击选择Modify(修改),把http://www.google.com/改为下面的Google的其他数据中心的地址即可,如http://64.233.167.104/,以后在搜索时查看Google网页快照就不需要使用代理了。
②有效代理,突破封锁
寻找代理服务器是突破ISP封锁的最简单方法,下载一个代理服务器搜索工具(如“代理猎手”ProxyHunter等),根据工具再找一个有效的代理,通过代理访问快照网页,突破ISP的封锁。
③修改域名,转向访问
使用www.google.com访问快照经常会被过滤,这时我们可以将搜索的域名地址进行修改,例如改为http://www.google.com/u/berkeley或http://www.google.com/custom。这样就能有效地解决快照访问的问题了。Google的网址还可修改为:http://google.7766.org、http://64.233.167.104/等。
提示:Google的其他数据中心的地址还有:http://66.249.81.99/、http://66.102.7.104/、http://64.233.161.104/、http://64.233.161.104/。
附录:关于网页快照的其他一些说明
1 哪些网页是看不到快照的?
答:未编入索引的网页是没有快照的,或者应网页主人要求,删除了快照,这样也是没有快照的;
2 网页快照多久更新一次?
答:多久更新一次可不好说,这要根据各搜索引擎程序的爬行程序来定,但我想不会也没必要太频繁;
3 为什么有些快照会无法打开?
答:快照只保存了网页的HTML部分,并不保存网页的全部内容。打不开快照可分为三种情况:
1)网页文本下载如果规定在图片和一些动态文件后,而这些需要先下载的文件刚好无法下载,则快照可能无法打开。
2)若图片或动态文件下载速度慢,会因为超时而打不开快照。
3)有些快照中涉及了违法内容,所以不会让你看到。
4 为什么有些快照打开了却看不到内容?
答:快照会对网页内容进行过滤,可能不会显示音乐,图片文件,也许你碰到了图片比较多的网站哦,如果网页本身就只是由一个动态文件(或一些java特效)或FRAME构成,则快照即使打开,也有可能什么都看不到。
5 为什么有时候点了一个快照却连到了其他的网页?
答:如果网页的源代码中有重定向命令,则快照可能会直接连到指定的网页。
6 为什么快照中会出现乱码?
答:这个分为五种情况:
1)网页指定了错误的编码。
2)浏览器不支持该网页使用的语言。
3)浏览器错认了该网页的语言编码。
4)搜索引擎对文字编码错误。
5)搜索引擎未能正确识别和显示字符。
本文标题:网页快照-Google 网页快照启用新的域名:googleusercontent.com61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1