61阅读

百度站长索引量-百度是否已经能识别网站中的js代码并加入索引

发布时间:2017-09-16 所属栏目:百度索引量

一 : 百度是否已经能识别网站中的js代码并加入索引

最近分析网站日志,发现一个奇怪的现象,百度蜘蛛开始爬行网站里的js文件了,而且几乎每天都来爬行,这个现象也得到很多站长朋友的证实。就百度蜘蛛爬行js文件到底能不能完全识别js代码里的链接以及文字特作了以下分析:

1、大批量利用js作弊的网站被降权甚至被k  

大家都知道,百度对淘宝的东西是相当敏感的,因此淘宝客的网站是一类利用js隐瞒蜘蛛爬行的典型网站,然而自从百度6-28(6月28日大批量网站被k)事件开始,淘宝客类型的网站当然是受到了重创,不少以返利为盈利的淘宝客站长收入一度下降,就这一类型的网站底是不是因为百度技术升级而识别了js里面的淘宝链接呢?

2、新站设计js作弊的网站一律不收录  

本人新做一个淘宝客的网站还是继承以前的模式,淘宝链接用js代码隐藏起来,但是过了十天、半个月,到现在已经一个月过去了百度就是不收录,蜘蛛天天都会来爬,就是不给收录,而且还会爬行js。当然这也正常,但是当了解到很多想再以这种模式爬起来的淘宝客站长也是跟这种情况,不得不让人开始怀疑百度蜘蛛已经开始读懂js代码了。

js文件爬行记录

蜘蛛爬行js文件日志

3、利用百度统计分析网站时可以分析出js代码里的链接

相信很多站长如果网站收录不正常或者是长时间没有被百度收录的话都用试用各种工具去分析网站,本人新站不收录,便利用站长统计工具分析网站的seo情况,不分析不知道,一分析吓一跳,百度站长统计里面的网站诊断既然能分析出js里面的链接,既然这里能识别出js代码里面的链接,相信蜘蛛也能识别js代码的链接。

js链接识别

(这些链接都是用调用js代码的在百度统计里面完全能分析出来)  

综上所述,即便是知名国外GOOGLE也未能完全识别JS代码,但是相关的例子以及事实证明百度对JS至少有了初步的识别功能,至于能识别到什么程度,希望阅读本文的志同道合人士进一步详细分析给出更有说服力的例子。

文章来源:www.doota.com,转载请标明。

注:相关网站建设技巧阅读请移步到建站教程频道。

二 : 百度声明:站长不必过份关注索引量

今天百度站长平台发布了一条声明:站长不必过份关注索引量,索引量与流量结合起来看:当发现流量发生较大变化时,可以从索引量数据分析原因。反之,即使索引量有巨大波动,只要流量没有发生巨大变化也不必激动。

我们提醒站长,索引量仅指被百度搜索引擎建立了索引的网页总量,表示网站中有多少页面可以作为搜索候选结果,不同网页因内容重要性、稀缺性不同,被展现的几率有很大差别。换(www.61k.com)句话说,既使你的网站有1亿个网页被建立索引,也许真正能获得流量的仅有100个页面。

三 : 最近网站的百度索引量和收录明显下降是怎么回事?

  百度索引量是每个站长都很关注的数据,索引量的多少以为这参与百度网页排名数据量的多少。今天早上在百度站长平台查看了一下索引数据,令我大吃一惊,索引量在一夜之间减少了588,由之前的1187变成了599。当然,在这个过程中,我在数据统计后台看到的百度来路流量并没有减少的迹象。按照百度官方的说法,这种情况站长不用太在意。

  在向下探讨之前,先来看几个基础知识。

  百度索引量是什么?百度的索引量是百度蜘蛛抓取网站的页面数;

  百度索引量和收录量的区别?百度索引是百度蜘蛛抓取网页内容建立的搜索候选页面,这些候选页面是未来增加网站收录和更新网站页面快照必须要有的。百度索引量在百度站长平台后台查询,收录量直接使用site:(域名)

  为什么索引量会大幅度下滑,这个问题朱海涛并不专业。看过站长社区版主老吕的一篇文章,分析的相当详细。对比了下,唯一的可能性就是robots.txt文件。前几天我在robots.txt文件总增加了一句"Disallow: /*?*",禁止收录一切包含问号的链接,来屏蔽动态链接。

  除此之外,空间服务商还在.htaccess文件中增加一句代码 "deny from 220.181.158.218".空间上设置这句代码是防止网站恶意流量的。我查询了下,这个ip地址对应有可能是百度蜘蛛,不知道空间商在帮助我屏蔽恶意访问流量的时候是否有考虑到这方面的因素。

  不管怎样,保险起见,还是需要去站长反馈中心去反馈下问题。站长反馈的时候注意描述清楚,并且截图说明问题。百度站长平台申诉反馈地址: http://zhanzhang.baidu.com/feedback

  下面是百度站长平台社区版主老吕的文章,详细说明了索引量为什么会下降的原因,并且给出了解决方法,值得每个站长认真的阅读一遍。

  索引量是流量的基础,索引量数据的每一个变动都拨动着站长敏感的神经,“索引量下降之后该如何着手分析”一直是各位讨论的热门话题。这次站长社区版主老吕又拔刀相助了,看看史上最全的百度索引量下降原因分析及解决方案吧

  一、百度索引下降分析简图

  二、导致百度索引量下降的常见原因——网站方原因

  1、内容数据所在的网址url未规范统一

  【自己站点url规范统一】

  多域名都可以200状态正常访问网页内容;一域名下出现多种url形式可以访问相同内容,如大小写url、url规则变更等。

  解决:选择主域名(或主url),其他域名下的所有url都301重定向到主域名(或主url),并站长工具提交域名改版(或目录url改版)

  【外部平台使用己站数据】

  A、市场合作,站点数据调用到其他平台上;内容主动外发,推广人员完整转发自有内容到高质量平台——这两个原因都有可能导致搜索引擎收录了外部平台的内容而拒绝了原网站内容

  解决:使用站长平台链接提交工具的主动推送功能,及时提交网站新出现的链接,延迟将内容调用到其他平台的时间;

  B、被镜像,用户通过其他举办主体的域名或url直接可访问己方内容。

  解决:关注域名解析安全和服务器安全;绑定唯一可解析的域名或唯一可访问的url;页面内容中链接使用绝对地址

  2、站点受青睐度下降

  【网页内容相关】

  A、内容质量度下降

  解决:提高内容质量度,详见百度站长学院相关内容;杜绝简单拷贝,多做整合信息。

  B、更新量及频率下降

  解决:稳定的更新频率,视内容发展情况,扩充编辑团队,生产更多新内容,让网站索引避免下降,持续增加。(当更新量及频率下降明显,那么配额就会下降,首先表现抓取频次下降,导致索引量下降)

  C、时效性信息消失

  解决:时效性的信息,大部分一般在数据库不会长期保留,所以需要持续挖掘新的时效信息点,整合相关内容。

  D、部分区域出现不良信息

  解决:杜绝大量外链软文、恶劣弹窗广告、非法敏感类信息、专门针对搜索引擎作弊的内容等

  【触犯惩罚算法】

  解决:关注站长工具消息和百度网页搜索动态。按官方公告说明来整改站点,并进行反馈,然后等待算法更新。

  【特型url不被信任】

  解决:定制各类url的索引查询规则;定位索引量下降的特型url;排查该类url当日、前一日、本周、历史索引情况;找出未被入库的数据可能存在的问题;处理完后,增强该类url与百度数据沟通(途径有sitemap、批量提交url、数据推送等)。

  【站点被搜索引擎信任度下降】

  A、非法投票嫌疑(链接工厂等)

  解决:珍惜自己页面的投票权,对于劣质网页坚决不投票,尽量减少站点的导出链接。

  B、主题变动(如从教育领域跨入医疗领域)

  解决:将旧领域的网页进行死链处理后向百度进行提交,封禁相关旧url的被访问权,然后再上线新主题相关内容,加强对百度的数据提交

  C、受牵连

  相同ip下非法站点偏多,同一域名所有人举办的网站大都被惩罚且情况恶劣等

  解决:离开恶邻,获取搜索引擎的各产品的相关反馈方式,请求给予解禁,等待恢复正常索引。

  D、政策性原因

  如香港主机、国外主机站点由于各种你懂的原因,稳定性可能较差

  解决:国内主机备案,合法符合政策经营

  3、网页模板相关

  【主体内容区域对蜘蛛的限制】

  解决:取消登陆查看信息等限制,让蜘蛛便捷畅快的“采集”到己站数据

  【启用了对蜘蛛不友好的技术】

  解决:对需要蜘蛛识别的内容,不要启用对蜘蛛不友好的技术来调用。

  【响应式模板干扰蜘蛛识别页面类型(pc、移动)】

  解决:提交特定的url对应关系(尽量parrten级);meta标记移动版本url及适合浏览的设备;自主适配;增强pc、移动不同模板源码标签的区分度,帮助百度识别页面类型

  4、源码相关

  【源码错误较严重,如编码错误、标签使用错误等;源码改动严重,蜘蛛“采集”数据后重新观察分析;某类url下的TD(网页title、description)变化,如变化比例大、变化页面量大,页面进行更改后会重走建索引库流程,如果页面质量达不到建索引库标准会从线上消失】

  解决:校验源码,准确的源码是蜘蛛“采集”数据进行分析的基础;link内链结构、url地址形式、页面主题、页面各区域html标记等尽量维持改动前的情况;逐步、分期更换TD(网页title、description),结合页面主题、用户实际需求来制定合理的TD,不欺骗不误导用户。

  5、已入库的url对蜘蛛状态有变化

  【robots声明,禁止蜘蛛抓取】

  解决:查看百度站长工具robots及抓取情况。

  【url规则变化,原有url无法访问】

  解决:特别是linux和win服务器之间的数据迁移,可能会出现大小写url支持变化,确保各类url规则不变化。url必须重构的时候,做好旧新url301重定向,站长工具提交改版需求。

  【提示错误页面】

  解决:由于误删,则可以数据恢复,并维持url对应网页内容的更新变化,提高抓取频次。如果确定要删除,那么提交死链,删除死链后,再robots禁止,这种情况的索引下降无需担忧。

  【被入侵】

  解决:防止url对蜘蛛进行非法跳转操作;防止url对应的网页内容对蜘蛛出现内容大变化,特别是一些违法乱纪的内容

  6、DNS、服务器问题

  【DNS问题】

  dns不稳定;dns不安全

  解决:选择可靠的dns服务;沟通强调对蜘蛛的稳定性;防止dns解析到非正常ip;防止解析的网站ip频繁变动。防止dns管理漏洞,导致被恶意解析;防止dns解析挂靠在小代理等技术能力、管理规范、道德法律约束都欠缺的平台上。

  【服务器问题】

  A、可访问性差

  解决:尽量让目标地区所有运营商来路的用户都能在3秒内打开网站,最佳1秒内;监控网站运行状态,合理设置目标地区的所有运营商监控节点及监控项目、监控频率

  B、屏蔽百度ua或ip

  解决:多利用百度站长工具,查看百度抓取网页的情况,可见

  

  C、防刷压力值设定

  解决:将蜘蛛解析到专用空间;如出现访问陡增的ip,查看是否为蜘蛛再确定是否禁止访问。

  三、导致百度索引量下降的常见原因——百度方原因

  1、配额再分配

  同类数据量接近索引分配总额,配额量再分配,有升的就会有降的

  解决:超过竞品,争取高额分配。

  2、数据异常错误

  A、错误惩罚

  应对某类作恶行为而新算法上线,但由于蝴蝶效应,导致部分站点被错误惩罚而清除大量索引。

  解决:反馈百度方,请求解除惩罚。

  B、地区性数据异常

  部分地区数据抓取或查询异常,导致误判站点情况而清除相应索引数据或输出错误索引量,如百度dns系统升级事件。

  解决:反馈百度方,由百度检查各地蜘蛛执行情况。

  C、接口调用数据错误、数据丢失、数据备份衍生异常

  解决:反馈百度方,由百度检查相关数据情况。

  说了这么多,有的站长遇到百度索引量下降情况可能还是仍然不知道怎么办。最基础的做法是去百度站长平台查看下robots.txt的设置,然后分别抓取网站每个分类目录和二级域名的网页,查看是否抓取正常和验证robots.txt文件是否设置有误。

  如果都没有问题,再检查下友情链接和外链数据。当然如果网站转载文章和抄袭文章过多或者原创质量过低,这样收录量和索引量下降是迟早的事了。此外,网站索引量下降未必是坏事,如果我们的网站存在大量重复网页,动态网页,和无效网页,这些网页都被百度索引带来的是副作用。

  设置robots.txt文件(利用robots文件做SEO优化,让蜘蛛更好的抓取网站)必然会导致索引量的下降,这种情况下,索引量下降对我们网站是由好处的。

四 : 新站如何快速提升百度索引量?快速提升百度索引量的方法

新站如何快速提升百度索引量?百度收录量在某种程度上可以提高网站的知名度,促进流量的攀升,所以,在网站起步阶段,想办法提高网站百度收录量和增加百度友好度就是一项很重要的工作了。作为国内草根站长的一员,在长期的工作过程中,也慢慢的积累了一些经验,小编简单的总结如下,以期对大家在网站建站初期有所帮助。

一、在本地做好网站的调试工作

很多新手在建站的时候,急于把网站上传,结果很多问题都没有处理好,新站在上线后,切记频繁的修改网站结构和内容。所以,在上线之前的调试工作,一定要做好,完成网站基本的框架以及网站标题和内容的设置。

二、网站空间的稳定性

空间的稳定性是保证百度收录提升的重要环节。良好的访问体验,是收录的前提保证。百度蜘蛛每天定时访问你的网站,抓取你的内容,如果你的网站隔三差五的中断,这样的效果,肯定是不值得提倡的

个人建议:购买独立IP的空间,空间最好是南北互通的,现在有很多多线空间可以选择。不要找十分便宜的空间,到最后吃亏的还是你自己。

三、保证文章的质量

网站到最后看的还是内容,内容的质量决定用户体验的好坏。所以高质量的文章肯定是收到百度的亲睐的。原创的文章在百度抓取的时候是可以得到识别的。

个人建议:在网站发布文章的时候,多发表一些高质量、原创的文章,可以获得更好的百度抓取,得到更高的权重,如果原创文章实在写不了的话,可以进行伪原创,找些文章整理一下。

四、网站外链建设

一个网站不仅要做到内部网站的工作优化,而且引入高质量的外链也很重要,这样可以更好的进行权重输出,现在很多的网站都是靠大量的外链堆出来的,所以适当的外链建设是必须的。

个人建议:在你发放外链的时候,先查一下网站的权重,快照时间,发布的页面是否能够快速被收录,这样可以及时的引蜘蛛到你的网站里去。其实最好的方法,就是去投稿,比如到站长之家,写几篇关于你建站的心得,这样的外链效果是非常好的。

以上就是61阅读小编带来的快速提升百度索引量的方法,希望可以帮助到大家,更多内容请关注61阅读网站!

五 : 网站索引量大减的应对之道

  最近经常听到朋友说一句话:“百度是不是在抽风,网站索引下降好多”。都在抱怨百度说这是要做啥,是要把我们网站往死里能吗?然后就开始在论坛和QQ群进行一番大喷。就好比非要把心中这种恶气发泄出来不可,其实,小编在这里想说的就是对于网站索引大减这种事情。站长没有必要进行这种方式的不满,最重要的就是想要从哪些方面解决这种情况,而不是发泄一番之后,听之任之放弃网站。

  对于问题的出现,还是要本着解决问题的思路来思考。下面小编就从两个方面来说说网站索引大减的因素。

  1、审视之前对网站进行的调整

  网站在进行优化过程,要进行从内容和外链,内链以及其他方面进行推广。然而,这种细节性的东西,都会在优化网站一段时间之后,出现各种各样的问题。例如,网站内容更新质量以及是否外链过于单一,使用一些群发软件进行网站链接建设等。如果网站都是采集互联网资源,并且不加任何的修改,完全不在乎质量,在之后搜索引擎考察过程,很容易判断出网站是一种垃圾性网站,一旦判定搜索引擎就会从本着从用户角度,把网站内容高度重复于互联网上东西剔除搜索。试想一下,如果用户在搜索内容是否,发现不同网站内容高度相似甚至是重复,那些对于这种搜索引擎来说就没有存在意义。这也就是为什么网站索引大减的原因。

  2、不合理的链接结构

  人都是两个胳膊两条腿,一个脑袋一张嘴,两个耳朵,两只眼睛等人体结构,其实网站也是一样,首先首页-列表页(频道页,栏目页)-内页构成。有些网站还包括其他页面例如专题页面,搜索页面,标签页面等。这些页面都在于网站中,形成一个类似人体的完整结构。然而,这些单独页面如何进行相互关联的、这就是网页之间一种枢纽-链接。就好比人体的血管一样,把人体各个部分进行连接起来。如果那一部分血管出现问题,都会造成伤害,轻者出现流血,重者导致死亡。网站也是一样,如果网站内部链接不能合理搭配到网站中,就会导致蜘蛛在抓取过程中出现很严重的障碍,甚至不能找到一些网页等这些轻微状况。如果网站死链过多,那就会导致很严重的问题,搜索引擎把死链接剔除数据库,这也是导致网站索引下降的重要原因。

  

网站索引量大减的应对之道

 

  以上两个都是导致网站索引下降的因素,前者更重视网站内容内容方面,这些一般站长很好从内部进行解决。另一个方面就需要借助搜索引擎提供的工具进行协调解决。

  网站索引量大减从哪些方面改进以及网站优化的应对之道,进行让网站驶向正确的轨道上面。

  1、其实,小编在上面就已经说出来。网站内容方面严禁照抄互联网上面的内容,对于互联网产生的内容不同网站直接采集过来采集过去,搜索引擎数据库中都会一一记录下来,搜索引擎在抓取你网站内容过程中,都会在抓取过程中,进行互联网上内容对比,随着搜索引擎对网站分析就会发现内容采集情况,重复度比就会慢慢暴露出来。因此,对于网站质量,站长一定要严格把关,特别是对于新站来说,一定要做好内容质量问题。

  2、死链问题及时处理。对于死链,小编在上面说的已经很多了,出现死链及时解决,提交给搜索引擎或者找到对应链接及时处理,或者是进行跳转等行为,是在不行可以做404页面,来告诉蜘蛛。

  3、适当做一些外链,增加蜘蛛来网站的频率,增加蜘蛛来网站入口等让蜘蛛尽快抓取到新的页面或也可以主动提交链接。

  4、是否百度更新造成。因为搜索引擎每次更新都会造成网站一段时间的不稳定,特别是搜索引擎每次的大更新,出现索引大减,问问同行和周围的朋友网站是否出现跟自己一样的情况,如果是可能是搜索引擎造成,过段时间就会慢慢恢复,如果不是就要照上面的方法去检查网站。

  因此,网站出现索引大减的情况,不是从嘴里说出一些过激的话语。而是静下心来,慢慢细节地方去查看网站是否真正存在情况。如果存在就要去解决,这样才能让自己的网站变得越来越好。

  本文由郑州网站建设原创,原文地址:,转摘请保留版权,谢谢。

本文标题:百度站长索引量-百度是否已经能识别网站中的js代码并加入索引
本文地址: http://www.61k.com/1060541.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1