61阅读

站长工具查询-站长工具开源分析之HTTP状态头查询原理与代码

发布时间:2018-02-13 所属栏目:站长

一 : 站长工具开源分析之HTTP状态头查询原理与代码

通常站长朋友们会比较关心网站的404状态、301状态、302等状态,有时候302跳转可能被判为作弊,所以检测是301还是302比较重要,另外如果首页看似可以正常访问,但返回的不是200状态码,对搜索引擎来讲可能存在一些问题!同样,如果设置网站404错误页面时,如果采用跳转,设置不当,返回状态为302也会存在一些问题。

一般会到一些站长工具上去查询,落叶在早期制作站长工具时,通过很多方式思考过这些状态是怎么查询到的,原理是什么,PHP上怎样才能检测到网站页面的状态是不是404等。

本文作为落叶对站长工具“开源分析”系列文章的一部分,对HTTP状态查询的方法进行一些总结,希望大家有兴趣关注。

当用户在浏览器中输入一条网址,敲下回车后,浏览器向网址所在的服务器发出请求,服务器通过一些处理后,将信息返回给浏览器,浏览器再显示出来。服务器返回的信息中就有一部分包含HTTP状态码,那么就包含我们所熟悉的404状态,200状态,301状态等。

我们使用一些浏览器手抓包工具如httpwatch、finder等,通常会观察到返回的HTTP头信息大概如下:

HTTP/1.1 200 OK

Content-Length: 35264

Content-Type: text/html

Content-Location:

Last-Modified: Sat, 13 Aug 2011 03:27:37 GMT

Accept-Ranges: bytes

ETag: "742a1f36859cc1:6c6bc"

Server: Microsoft-IIS/6.0

X-Powered-By: ASP.NET

Date: Sat, 13 Aug 2011 12:18:05 GMT

其中大家一眼就能看到200状态。

那么从站长工具程序角度来看,大概我们需要做的是先能程序去自动访问目标页面,然后抓取返回的HTTP头信息,然后通过正则或者某些方式对返回的头信息进行处理,提取其中的状态头。

我们首先想到的是PHP自带的函数get_headers:

<?php

$url = 'http://www.example.com';

print_r(get_headers($url));

?>

即可得上述状态头信息,但实际使用中WIN平以下效率非常低,查询慢不说,经常查询失败,起初落叶考虑采用循环查询多次,直至成功的方式来返回结果。效果肯定不会太理想,所以重新考虑到更好的方法。

考虑到HTTP状态检测的过程实际也是采集的过程,采集的利器curl应该有更好的方法,一翻研究了解到PHP CURL中有一个提取HTTP头的函数curl_getinfo,不需经过特殊处理直接缓存干净地HTTP头数组,并且稳定比较好。具体代码如下:

<?php

$url=http://www.***.com;

$curl = curl_init();

curl_setopt($curl, CURLOPT_URL, $url);

curl_setopt($curl, CURLOPT_RETURNTRANSFER,1);

curl_setopt ($curl, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)");

curl_setopt($curl, CURLOPT_HEADER, 1);//设置采集HTTP头信息

curl_setopt($curl, CURLOPT_NOBODY, 0);//设置不采集内部部分

curl_setopt($curl,CURLOPT_ENCODING, "gzip, deflate");

$data=curl_exec($curl);

$m=curl_getinfo($curl);//处理返回内容获到HTTP头数组信息

curl_close($curl);

if(empty($data)){

return 'fail';

}

echo $m['http_code'];

}

?>

返的$m数组中直接输出$m[‘http_code’]即得到了HTTP状态头。

当然CURL函数的使用,需要服务器开启PHP_CURL扩展,下面是对CURL扩展开启方法的介绍:

1、  将PHP文件夹下的三个文件php_curl.dll,libeay32.dll,ssleay32.dll复制到system32下; 

2、  将php.ini(c:WINDOWS目录下)中的;extension=php_curl.dll中的分号去掉; 

3、  重启apache或者IIS。

作者:落叶(t.qq.com/guohui) 网站:http://www.pmume.com

落叶原创,首发61k,尊重版权,转载请注明出处

注:相关网站建设技巧阅读请移步到建站教程频道。

二 : 站长帮手首推360权重查询工具

站长帮手网今日推出了360权重查询工具,该工具可以查看某个网站的关键词在360的排[www.61k.com)名情况,以及这些关键词能带来的大概流量,从而计算出这些网站的360权重。不过这仅是第三方查询工具,360搜索官方并没有提供权重查询,仅供参考。这也是国内第一个推出360权重查询的网站。

试用了一下,发现360权重查询和百度权重查询的原理一致,[email protected],[email protected]?给网站带来的流量值给的排名,也是分为10个等级。

感悟:除了查询关键词排名不同之外,这款工具与百度权重查询太过于类似了,但作为关键词数据分析有一定参考价值,但360权重查询能否向百度权重这样在站长圈流行起来估计很困难。

工具地址:http://360.links.cn

三 : 站长工具:爱站、去查站长工具哪个更好?

  站长工具、爱站、去查站长工具哪个更好?很多人都会问这个问题,在百度上一搜此类相关的问题一大把的。我自己在怀化网络公司从事网络工作的这几年每天一直都是在接触站长工具,收集的站长工具平台也比较多,个人感觉各有千秋吧,下面就以实际的数据来说下这些工具的差别。

  在批判一个站长工具是否”好“。好的标准应该是从以下几个方面来”打分“的:1、数据的准确性。 2、用户体验感。

  一、首先说下第一点:数据的准确性。

  无论哪个站长工具,如果数据不准确将是最大的致命弱点,访问者将不在会有下次访问的机会。来看下以下笔者的实际下各大站长工具的准确性!(笔者将已经被拔毛的公司网站(www.***.com)拿来测试。)

  chinaz站长工具测试结果: 百度权重0 PR2 收录168 反链2万2000 快照隔天 排名无 (为了检测数据真实性可以直接百度SITE等)

  aizhan站长工具测试结果: 百度权重2 PR2 收录168 反链2万1900 快照隔天 排名无

  7c去查站长工具测试结果: 百度权重0 PR2 收录168 反链2万2000 快照隔天 排名无 (注:其他更多的站长工具就不一一叙述了,网址已经给出来,大家可以自行对比。不过大致上数据都是差不多的,只有爱站的数据有点小小的给力。)

  爱站的百度权重2哪来的???? (图1)。 然后我抱着一探究竟的精神,点击了那个让我惊讶的百度权重2,结果更惊讶的事情发生了,请看下图.

  图1

  图2

  以前听别人说爱站工具还蛮好用的,比较权威。可是我觉得在好的东西总会有瑕疵。经此一事我绝对还是chinaz靠谱点。可是看了下面的数据你又惊讶了。话说有一天我无聊的去查询自己怀化网络公司网站关键词百度指数,结果我发现chinaz百度指数和其他站长工具上不一样。有图有真相。可实际上我去查询这2个词的百度指数,怀化网络公司 为63 怀化网站建设为0。

  图1

  图2

  尼玛这个chinaz也是坑啊!别告诉我您这个百度指数是全年平均值,别告诉你这个百度指数计算方法是独家自创。并且问题还不仅仅是出现在这2个站长工具上。请看下图:

  为啥到了去查站长工具,出现频率都高了??别告诉我你连tietl和meta标签内的关键词也算关键词密度之内吧?好吧太强大了。这个站长工具的数据准确性,都不敢恭维啊~~更多坑爹数据等待广大站长们,seoer们继续发现吧。

  一、现在来说下第二点:用户的体验感。

  根绝我个人的认知:用户体验的标准是:使用方便、功能快捷、视觉舒适、纯净无广告。网站用户体验感的定义是:指的是利用网络特性,为客户提供完善的网络体验,提高客户的满意度,从而与客户建立起紧密而持续的关系。

  个人点评:

  chinaz站长工具:整体由上而下的上下结构布局,导航——搜索——说明——推荐链接 从中我们能看到设计者的精心策划。导航中弹出的下拉工具并没有因为其繁多而让我们感觉到很乱因为它已经分类了,这是非常明显的。综合查询结果,一屏就能全部看完网站的重要数据。批量查询更是省去了多次点击的繁琐。如果说缺点,那就是查询的人有点多,偶尔会出现打开慢,或者报错等情况。个人打分:★★★★☆

  aizhan爱站:和chinaz最大的区别是他是左右结构的布局,从导航上,没有chinaz工具的丰富。但aizhan的关键词挖掘功能个人觉得还是比chinaz要强很多。以及爱站的友情反链查询更是推出了内链查询功能,至于好不好用,这个希望用过的朋友在下面留言处详细说明分享下。整体上还行,不过实用功能少了很多。个人打分:★★★☆

  7C去查:个人觉得去查就是爱战的翻版,除了 首页布局不一样以外,内页都是差不多的,功能也差不多,包括颜色也是蓝色主色调。不过有一点去查查询关键词排名的时候,会显示全国很多地方的关键词的排名这是其他工具所没有的。个人觉得非常不错,个人打分:★★★

  webmasterhome中国站长之家:比较早期较老的站长工具了,以前使用的人还可以.个人觉得该网站怎一个乱字了得啊!或许它真的跟不上我们的审美观了。功能数量还是比较多的,但是首页查询窗口却很少,以至于下面都出现了身份证和手机号码查询了。。导航中还有天气查询等。。。该网站给我最大印象就是可以做外链。就是你查询的数据会自动生成一个页面,并且这个页面会很快被蜘蛛爬行收录。我以前有个站,外链有400+基本90%的外链来源于此。如此多的外链是因为我隔几天就去那查询,他每月都有大几十的外链。个人打分:★★☆

  其他的站长工具还有很多,我就不一一的介绍了,如果你觉得还有其他比较奇葩的站长工具希望能在下面留言分享出来。

  说了这么多,SEO94认为工具毕竟还是工具,以上分析仅仅是提供个参考。就好像黄小琥说的“别人说的话随便听一听,自己做决定”是一样的。

  以上文章由宏建机械(www.hjhjjxc.net)原创撰写,尊重原创,转载请保留此链接!

本文标题:站长工具查询-站长工具开源分析之HTTP状态头查询原理与代码
本文地址: http://www.61k.com/1137597.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1