61阅读

搜索引擎原理-冯志亮:解析网站在搜索引擎中被处理原因

发布时间:2017-10-28 所属栏目:建站

一 : 冯志亮:解析网站在搜索引擎中被处理原因

网站在搜索引擎中被处理,如网站首页搜索没有收录、网站收录被拔掉、排名下降、都是网站被处理的现象。网站被处理是网站管理员最为头疼的事之一。以下是网络分析师、网络策划人冯志亮先生简单介绍解析几种被处理的原因和应对方法。

服务器运行是否稳定,当搜索引擎抓取时,服务器有没有正常运行,日志中是否返回是200状态码?如果是200状态码,那就只是个暂时现象,放平心态,等搜索引擎大更新时放出来。

目前大多数搜索引擎都遵守robots协议,如果在robots写法设置不当,直接影响搜索引擎抓取收录工作,检查robots.txt文件设置是否正确。

网站是否为了关键词推广而采用了作弊手段,比如关键词修改,标题修改,关键词密度,Meta属性修改,网站内容结构,内容作弊等,如果网站内容优化不当,会造成很严重的后果。

网站是否遭遇黑客攻击,不能打开或者被放置木马、病毒等,一般这种现象不会受到搜索引擎处理,但影响用户体验,如果遭到搜索引擎用户的投诉,会受到搜索引擎人工网站调整。

网站是不是内容修改,设置了404页转向,或者JavaScript跳转或者服务器301转向302转向等都有可能造成影响网站信任度,受到惩罚处理。

网站交换合作友情链接,如果部分网站被搜索引擎认为作弊,并受到惩罚,而你站正好与之交换,有时同样受到牵连,网站友情链接过多过杂,同样面临被搜索引擎K掉的危险几率增加。

如果网站被复制过多,不但造成网站信任度下降,有时搜索引擎会误认你的网站来源与复制或者采集等,网站面临复制的嫌疑,如果网站权重又高,影响网站信任度,面临被k危险。

如果你的网站曾经做个搜索引擎竞价排名广告,当竞价广告撤除时,有时会面临被搜索引擎处理的危险,轻则排名下降,重则网站被k等。所以说做竞价广告不利于网站长久发展,有钱时你刚刚的,没钱时你就Over啦,还是自然排名好啊。

如果你的网站采用群发信息的方向进行推广,这样有时会造成反现象,网站乱发信息,被搜索引擎判为作弊,搜索引擎讲究合作的运营推广,如果是大量采用人工,群发软件发送信息不当等,有时网站也会被K掉。

有时更换服务器,现在网站ip也会随之更换,如果你的IP地址上的服务器正好有很多搜索引擎认为作弊网站,IP地址以被搜索引擎封锁,那样,你的网站如果也放置在上面,同样也受到牵连影响,被搜索引擎判为作弊网站。

1、如果你的网站域名早期被注册过,早期域名网站作弊遭到搜索引擎封杀,那如果后来你又使用其域名,也要面临危险。

2、网站绑定域名过多,域名不一,内容相同,有时会被搜索引擎判为作弊,受到被k处理。

如果你网站的内容不符可国家法制信息,存在色情、赌博、反动等违法信息,网站会受到处理,因为国家法规不充许此类信息传播,搜索引擎同样也遵纪守法,不会把违法信息,提供给搜索引擎用户。

注:相关网站建设技巧阅读请移步到建站教程频道。

二 : 各大搜索引擎搜索原理及名称

搜索引擎蜘蛛是一个自动抓取互联网上网页内容的程序,每个搜索引擎都有自己的蜘蛛。(www.61k.com)

搜索引擎蜘蛛也叫搜索引擎爬虫、搜索引擎robot。

国内各大搜索引擎蜘蛛名称:

百度:百度spider

谷歌:googlebot

搜狗:sogou spider

搜搜:Sosospider

360搜索:360Spider

有道:YodaoBot

雅虎:Yahoo Slurp

必应:msnbot

Msn:msnbot

以上是常见的搜索引擎蜘蛛(爬虫),如果你的网站不想让让某些蜘蛛抓取,那么可以通过robots.txt来限制爬虫的抓取。

重庆APP开发:www.appkaifa9.com

三 : 搜索引擎更新原理分析

在这之前咧,也有好些朋友通过QQ或者留言的形式问过我这个问题!所以我想每个人都解释,还不如把我知道的总结一下写出来供大家参考。
首先了解搜索引擎收录网站的原理,搜索引擎一般通过以下几步来收录我们的网站;
1、抓取
这就相当于我们的网站在其他网站有一些链接。不管是百度还是google他们的探测器都是不断的发现新的内容,并进行实时更新。也可以理解一个成功的高质量外链。
2、保存
搜索引擎蜘蛛将收集来的网站集中到指定数据库进行储存,然后等待索引的处理。
3、整理
索引会将收集来的网页进行分类的整理、压缩,分类和压缩完成以后然后进行索引的编类,而未被压缩的原始网页资料将会被删除。
4、索引状态
搜索引擎会将压缩好的内容分别放在不同的索引栏目下面。
5、咨询状态
当用户在搜索引擎框输入搜索指令时,计算机会将用户问询的白话转化成搜索引擎能识别的计算机语言,然后从索引中找到相应更加符合的答案。
6、排名状态
搜索引擎会将相关的答案根据一定的标准进行排列给用户,同时搜索引擎也会将认为最好的答案被推荐到首位,较次的排列其后,以此类推。所以在这要强调一点,就是我们做站的是终目的是用户,而不是搜索引擎,要明白一点,搜索引擎也是在为用户服务。

以上六点中,最要强调的是第一点,也是最重要的,因为当搜索引擎在你网站抓取的内容越多,网站获得的权重越高。因为搜索引擎收录一般会认为的收到的第一篇文章就是原创,当这个网站来源是本身的时候,在搜索引擎自然就会有不错的表现。

其次如何让网站收录更快也是让人头痛的事,其实不然,只要我们在以下几点细节上稍加注意既可:
1、网站页面小,更容易抓取。
2、网站内部链接合理,更容易被抓取收录。
3、方便浏览者阅读。又是用户体验。
4、节省服务器的带宽

以上只是个人总结,仅供大家交流!

四 : 搜索引擎链接相关性原理浅析

  又说到了搜索引擎与网站制作优化方面的问题了,今天专门说说搜索引擎关于链接原理方面的东西,希望能对广大新手朋友有帮助.

  链接与搜索引擎的发展

  在很早之前,大概也就是在谷歌等大型专业的搜索引擎诞生的时候,那时候的搜索引擎往往是根据页面里面的关键词的匹配,根据关键词的相关性来进行排名的,大家应该可以想象到那个时候,大家看到的排名肯定是漏洞百出了。只要会做网站,在网页里面添加些关键词,堆砌一下,或者加入一些和网页内容完全没有关系的热门词,就能获得比较好的排名,而且还不是很难。所以,那个时候的网站制作对于排名方面很容易,完全没有现在的这么复杂的优化问题。现在,随着搜索引擎的算法越来越完善智能,搜索引擎排名就变得没有那么容易。现在的搜索引擎在链接上,增加了很完善的链接分析的功能,通过计算判断链接的相关性,这样就能减少很多垃圾的不相关的链接。主要也是为了提高用户的体验。

  链接对于图片视频搜索排名的应用

  现在的搜索引擎,在排名中计入链接的因素,增加相关性计算,这样也能够让传统的关键词没有办法进行匹配无法排名的文件能够被处理。比如图片,视频文件之前不容易进行关键词匹配,但可以通过链接进行分析,通过链接的信息,搜索引擎就可以对图片以及视频的内容进行排名了。所以,大家就能很方面的搜索图片视频方面的内容。大家在百度里面能看到,有一阵对不同内容搜索的分类,视频,图片,音乐,等等,这些在优化的时候,往往也是通过链接分析这些内容的相关性来进行的。很多网站制作公司目前已经通过针对视频,图片的优化获得了不少的流量。

  认识链接的相关性

  这里说起到了链接的相关性,因为搜索引擎的这个算法比较复杂,所以,这里不能以很具体的一个量来进行说明,只能以很抽象的文字来让大家了解链接相关性方面的问题,让广大新手朋友容易理解。搜索技术通过对链接大规模的内容分析,包括页面MATE标题,关键词,内容页面关键词密度,锚文本等进行分析,来判断链接内容是否相关。这也是为什么我们在一直强调找外链要找同行业的网站,内部链接的模块化等。

  很多朋友恐怕一直很想知道更多的链接相关性的问题,这个对排名的影响实在是没有办法进行直观的了解,不大容易通过数据统计等手段进行分许,因为没有人能够获得引擎关于链接的数据库,不能量化,很多时候,需要我们网站制作优化技术人员多观察积累经验了.

  本文来自:http://www.zwzsh.net

五 : 搜索引擎对于原创处理细节以及在算法所占比重实验

 

  白帽SEO,无非就是一个长期观察、针对实验、提练方法的过程,并没有什么深不可测的理论。这篇文章就是有关不同搜索引擎针对原创内容的处理细节以及在其算法所占比重的小实验。可以让你了解到如何观察搜索引擎以及如何有针对性进行网站实验。

  谈到原创内容,对于网站优化的重要性不用多讲,在任何一篇有关SEO的文章都会提到,并都会强调原创内容对于网站优化的重要性。但是很少有文章详细的描述不同搜索引擎对于原创内容的态度有什么不同。据我观察,其实不同搜索引擎对于原创内容的处理细节是完全不同,在其算法中所占比重也大相径庭。我们现在就做这样的一个小实验。

  实验对象:Baidu/soso/360 so/google/sogou/youdao/bing

  实验素材:原创文章 “警惕恶意垃圾外链对网站的负面影响”

  实验准备:

  第一步 3月23日上传原创文章,首发于新派网络公司博客

  地址: 标题:警惕恶意垃圾外链对网站的负面影响

  第二步 3月28日投搞于A5站长网

  地址: 标题:警惕垃圾外链对网站的负面影响

  第三步 被众多网站采集或转载,大致分为三种类型:

  A 正规转载,保留原文地址。 B 无节操转载,没有保留原文地址。 C 无良转载,改的乱七八糟。

  为了观察到更多内容,我在投搞于A5站长网之前,刻意修改了一下标题,内容完全一样。

  正式实验:

  为了保证不同搜索引擎能有充足的时间来索引内容,所以我们定在半个月之后进行观察。打开各大搜索引擎,直接搜索原创内容标题。

  百度(baidu.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:采集网站,属于 B 无节操转载,没有保留原文地址。其实就是盗版侵权的网站。

  第二名:A5站长网,这是我主动投搞的网站。

  第三名:A5站长论坛贴子,被网友用来刷论坛积分用的。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:A5站长论坛贴子,被网友用来刷论坛积分用的。

  第三名:转载网站,属于 A 正规转载,保留原文地址。

  搜索不同标题都没有原创首发网址被索引。

  百度结论:原创内容对于百度来说,并不按首发时间判断,而是由网站权重判断。通俗点讲,“啥原创不原创,谁面子大就是谁的” 极其不尊重内容版权也许是百度对于原创内容的态度。这对老老实实做原创内容的小网站来说,是个很大的打击,是不是你的东西并不是由你自己说了算。这里不能光是批评百度的声音,值的肯定的是百度对内容的分析能力非常厉害,我刻意修改了文章标题,搜索结果是不同标题的网址交集,证明百度完全明白这两次搜索是同一篇内容。

  搜搜(soso.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:转载网站,属于 A 正规转载,保留原文地址。

  第三名:第三名以下全是打酱油的结果。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:百度百科,属于 B 无节操转载,没有保留原文地址。

  第三名:转载网站,属于 A 正规转载,保留原文地址。

  第六名:首发原创网址,即新派网络公司博客地址。

  搜索不同标题都有原创首发网址被索引。

  搜搜结论:相对百度来说,搜搜对于原创内容态度鲜明的多,基本上是通过首发时间来判断原创文章。但是对于内容的分析能力比百度要逊色很多。这就出现为了两次搜索结果相差这么大的原因。

  360搜索(so.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:采集网站,属于 B 无节操转载,没有保留原文地址。其实就是盗版侵权的网站。(同百度一样)

  第二名:首发原创网址,即新派网络公司博客地址。

  第三名:转载网站,属于 A 正规转载,保留原文地址。(同百度一样)

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。(同百度一样)

  第二名:转载网站,属于 A 正规转载,保留原文地址。

  第三名:A5站长论坛贴子,被网友用来刷论坛积分用的。(同百度一样)

  搜索原文标题有原创首发网址被索引。

  360搜索结论:不想过多评论,只讲一句,模仿者想超越任重而道远。

  谷歌搜索(google.com.hk)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:采集网站,属于 C 无良转载,改的乱七八糟。

  第三名:A5站长网,列表网址,非投搞网址。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:首发原创网址,新派网络公司博客列表页。

  第三名:采集网站,属于 C 无良转载,改的乱七八糟。(与第一次搜索结果的第二名一样)

  谷歌结论:我不是美分,但我不得不由衷的赞叹来自美帝、世界第一的搜索引擎对原创内容态度和内容分析的能力,也许这是国内搜索品牌与国际搜索品牌真正的差距所在。想做世界品牌的搜索引擎,学着点吧。只想在圈里称王的可以飘过。这里发现一个小细节,针对google来说,列表页的权重真的比较高哦。

  搜狗搜索(sogou.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网址,即新派网络公司博客地址。

  第二名:转载网站,属于 A 正规转载,保留原文地址。

  第三名:采集网站,属于 B 无节操转载,没有保留原文地址。

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:采集网站,属于 B 无节操转载,没有保留原文地址。

  第三名:采集网站,属于 B 无节操转载,没有保留原文地址。

  搜狗结论:中规中矩的搜索引擎,对待原创保持尊重,对内容的分析能力也较弱,两次搜索结果相差比较大。

  有道搜索(youdao.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:打酱油飘过

  第二名:打酱油飘过

  第三名:第三名?没有第三名了.....

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名: 转载网站,属于 A 正规转载,保留原文地址。

  第二名:A5站长网,列表页

  第三名:打酱油飘过

  有道结论:只要下次别说你是做搜索引擎的就好了,大家能理解。

  必应搜索(bing.com)观察:

  第一次 搜索原文标题 "警惕恶意垃圾外链对网站的负面影响"

  第一名:首发原创网站,即新派网络公司博客列表页,非文章地址。

  第二名:正规转载列表页,非文章地址。

  第三名:无节操转载列表页,非文章地址

  第二次 搜索投搞标题 "警惕垃圾外链对网站的负面影响"

  第一名:A5站长网,这是我主动投搞的网站。

  第二名:无节操转载列表页,非文章地址

  第三名:首发原创网站,即新派网络公司博客列表页,非文章地址。

  必应结论:好吧,下次找列表页内容,就用你了。

  以上为七个搜索引擎关于原创内容的处理细节观察。尊重原创与否,只是不同搜索引擎的算法差异之别,并无对错之分。以上个人结论如果表现明显好恶之意,纯属个人性情,无意于干扰你的观察。以上实验素材少,周期短,难免出现偏颇,请各位看官谅解。通过这次实验,大概也了解到新派网络网站为什么在谷歌、搜搜等上面表现很好(有兴趣的朋友可以观察一下) 因为尊重原创的搜索引擎,必然在其网站排序算法中所占比例较重。如果所有搜索引擎都开始不尊重原创内容,都信奉“谁的面子大就算谁的”,那还有谁为互联网添加新鲜血液?

  原文出自新派网络公司博客: 转载请保留地址。

本文标题:搜索引擎原理-冯志亮:解析网站在搜索引擎中被处理原因
本文地址: http://www.61k.com/1067901.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1