61阅读

网站优化-多语言网站优化和hreflang标签

发布时间:2018-04-30 所属栏目:搜索优化

一 : 多语言网站优化和hreflang标签

  全网营销推广 A5营销双节大优惠

  从近两年我个人的SEO服务项目情况看,有越来越多的公司需要做多语言网站优化。国内公司做多语种网站,以电商公司居多,要往外卖产品。国外公司也有不少要做中文网站,不过电子商务类的不多,大品牌、留学/移民之类的比较多。

  如果涉及语言比较少,比如只有英语和中文网站,语言使用范围不复杂的话,做SEO时倒没有什么特殊要求,英文、中文网站可以放在两个独立域名上,也可以放在同一个域名的两个子域名上,甚至可以放在二级目录上,内容和结构等可以没什么关联,基本上可以各做各的。即使页面内容是对应翻译的也没问题,中译英或英译中,内容一样,语言不同,搜索引擎不会认为是复制内容。

  有时候情况复杂点,同一个国家使用多种语言,而且使用人数差别没有那么大,像中文在中国这样具有压倒性主流地位,如加拿大使用英语、法语,瑞士使用德语、法语、意大利语。一个语言也经常在多个国家使用,英语在英国、美国、加拿大、澳大利亚、新西兰,甚至新加坡,都是最使用广泛的语言。

  在这些稍复杂的情况下,需要考虑一些多语言网站的SEO问题:

  同是英文网站(或其它语言),不同国家或地区有各自独立域名,虽然也许有些许修正,如不同拼写(英国拼为colour,美国拼为color之类),但主体内容是一样的,怎样避免被搜索引擎认为是复制内容?

  一个语种页面收录良好,另一个语种收录有问题,能不能让搜索引擎知道另一个语种版本在哪里,从而改进收录?

  同一个国家,有不同语言使用者,怎样让搜索引擎知道这个页面是针对哪个语言的?

  使用hreflang标签设置语言和地区,可以帮助解决这些问题。

  hreflang标签的标准格式是这样的:

  hreflang标签分两部分,前面是语言,后面是地区。上面标签指明的是,这个页面针对中文(zh)、中国地区用户(cn)。

  对应的:

  指的是英文、澳大利亚。

  指的是英文、英国。

  在三个网站上,上面三个标签都放上,搜索引擎就知道针对不同语言、地区的版本是关联的,各自的网址是什么,并且不会被当成复制内容。

  还有几个细节要注意。

  hreflang标签可以放在同一个域名的不同页面上,也可以跨域名,放在不同域名上。

  hreflang可以只写语言部分代码,如:

  但不能只写地区部分:

  上面这个是无效的,只写地区代码ca,不会被自动判断为是英文还是法文。

  所有语言页面上都要加上所有hreflang标签,形成互相确认。中文页面指明自己是中文,同时指明英文版本在哪里,英文页面同样要确认自己是英文版本,对应的中文版本在哪里。

  代表语言的代码要符合ISO 369- 1 标准,代表地区的代码要符合ISO 3166-1 Alpha2 标准。写代码时最好到官网查一下,不要想当然。比如上面提到的,英国的地区代码是GB,不是UK,和域名后缀不一样的。

  中文的语言代码是ZH,不是CN。这个是有效的:

  这个是无效的:

  再比如,最近一个客户的日文页面写成这样:

  这个是错的。前面提到,可以只写语言代码,但日语的语言代码是JA,不是JP。

  再比如,韩语的语言代码是KO,不是KR,虽然韩国的地区代码和域名后缀是kr。

二 : 网站优化:网址规范化(URL canonicalization)

  SEO网址定律:规范的网址书写方式,有利于提高网站主页权重。

  1、出现不规范网址的原因

  搜索引擎会自动挑选最合适的URL做为一个网站的网址。众所周知,我们打开IE在地址栏里输入网址,根据各人用户体验的习惯不同,输入的方式也不同。这就是会出现不规范的网址的原因。如:

  l http://domain.com

  l http://www.domain.com

  l http://www.domain.com/

  l

  l https://www.domain.com(较少使用)

  以上这五种常见的输入网址的方式,明眼能看出来其实是指向同一个页面:主页。

  从技术上来说,在计算机处理时,每一个字符对应一个编码(详见计算机科学导论类书籍);而搜索引擎是把以上网址当成不同的地址来看待,虽然最终返回的都是主页。

  现在简要分析一下以上网址的技术问题:

  有没有带www,有什么不同?在DNS中,www是你要解析的主机名。在做域名解析时,会要你为域名:domain.com填写一个主机名,我们一般填:www 。当然,也可以填 bbs或者其它的诸如abcde等等。如果填,那么,主机返回的页面就不一样。对搜索引擎来说,这是两个不同的站点,两个不同的页面。两个都要计算PR值。

  具例:http://www.tianya.cn和http://focus.tianya.cn在搜索引擎看来就是两个不同的站点。其中,http://www.tianya.cn的PR值为8,而http://focus.tianya.cn的PR值等于6。但从人为上判断,这其实是同一个站点。

  另一个问题,带与不带index.html,对用户感觉没什么区别。但对蜘蛛说就感到比较晕:哪一个才是主页?蜘蛛到底该返回哪个页面?这种方法对蜘蛛不友好。

  https是加密网址,可以理解为http的安全版,端口:443,采用SSL协议,详见《TCP/IP协议》有关书籍。如果和http同时存在也会被认为是不同的页面,搜索引擎会分别计算,从而降低了http://www.domain.com页面的权重。如:http://mail.139.com的PR值等于6,而https://mail.139.com的PR值为:n/a。

  以上的不同的域名写法,造成的PR值的不同

  所以,一个网址在推广时,网址的规范写法很重要。这直接影响到域名的权重。而不带www的域名,对搜索引擎很不友好。毕竟蜘蛛是程序,在不规范的网址中要挑一个出来做为规范的网址,不仅浪费主页的权重,而且还浪费蜘蛛的时间和网络带宽。要知道,蜘蛛一生气,后果很严重。

  2、避免不规范网址降低网站首页权重

  据估计,现在网络上的网址,不规范的写法近30%。在浪费资源,浪费带宽的同时,有可能搜索引擎选出的规范网址并不是站长想要的。对站长来说,多个不规范的URL链接的存在不但不利于排名,更是分散了主页的权重。不规范的影响了网站的收录不是好事,必须避免。

  避免不规范网址,不管是新站还是老站,都是要长期跟进的一项工作。要有恒心才能见到效果。新站从一开始就注意到这点的话,一两年后,效果还是很明显的。具体如下:

  l 新站在发展友链时,尽可能地要求对方规范书写网址,统一写法。而老站,应尽可能地修复不规范的友链。

  l 内链中,首先自已要规范书写网址,文章发布时,也要规范书写网址。

  l 谷歌管理工具中,将不带3w的网址以及其它不规范的写法定向为带3w的规范网址。

  l 使用canonical标签。下节讨论。

  l 制作sitemap文件,在sitemap文件里全部使用规范网址,以利蜘蛛爬行。

  l 一些CMS中添加了许多文章,里面如有大量内链不规范,可在robots文件中禁止蜘蛛爬行,在修复后,再允许蜘蛛爬行。

  l 无论网站是否有静态化的功能,在开发和对系统设置时要做到系统只产生规范网址。

  l 设置.htaccess文件,用301重定向把其他URL重定向到规范网址。

  以上提到的方法可混合使用,具体情况灵活处理。网址规范化是让站长和蜘蛛非常困扰的一个课题。需要站长长期坚持才能见效。

  3、canonical标签与301重定向

  在2009年,Google,雅虎,微软共同发布了一个新的标签:canonical tag,用于解决网址规范化问题。canonical标签有什么用?

  1. 网址规范。

  2. 传递、继承页面权重。

  3. 重复页面精确重定向,利于蜘蛛收录。

  注意,canonical标签只对同一域名下的网址有效,如果跨站,建议用301重定向。这就是canonical标签与301重定向的区别所在。

  如下面所示网址的页面是相同的

  http://www.domain.com/archives

  

  

  那么我们可以在head meta部分加入如下代码:

  这样是告诉搜索引擎:后两个页面的内容是重复内容,是同一个页面,就是告知搜索引擎把相关的搜索信号都传递到第一个网址。

  这样一样所有含有这个标签的网页,不管它的URL是什么,搜索引擎最终都会只收录 canonical标签指定的那个页面,所有的权重也会在指定的这个页面上继承。这样,所有原本分散的权重都会集中传递在指定的这个页面上。

  另外,使用canonical标签要注意以下几点:

  1. 这个标签只是对搜索引擎起到参考和建议的作用,并不是像robots文件那样是个命令,就算是做了canonical标签,也不百分百保证是搜索引擎认可的规范网址,搜索引擎会智能地综合参考其他的因素进行判断。

  2. 在canonical标签中,最好使用绝对地址,虽然可以使用相对地址。

  3. 针对国内用户的网站特别注意,百度不支持这个标签。

  4. canonical标签指定的网址可以是不存在的页面内容,如404页面。如果闲得没事干的话可以这么做。

  5. 建议canonical标签在同一域名下使用。是否跨站,争议太大。

  什么是301转向?301转向也叫301网址重定向,是用户或者搜索引擎在向服务器发出请求指令时,服务器返回HTTP头的一个信息(一个代码,如:301、404等),用来告诉用户或蜘蛛:原来的网址现在不用了,永远转向新启用的新网址。

  301转向,能使新域名继承老域名的权重。

  cmfu是起点的老域名,而qidian是新域名。

  老域名cmfu.com用301转向新域名,权重也转向新域名。而老域名则被永远认为被转到qidian.com这个新域名上了。

  做301域名转向,可以用.htaccess文件,JS代码(如国内某知名电信服务运营商,大家可以查看其JS代码),ASP代码、PHP代码。

  现具例如下:

  Redirect 301 /path/from/ file.html

  上面的代码加到.htaccess文件中,主要是告诉搜索引擎,以后所有到/path/from/ file.html的请求,都转到上。301状态码,就是告诉蜘蛛,原来的页面被永远转走了。

  前面我们提到,将所有不规范的不带3w的网址转到规范的网址上。这时就要打开.htaccess文件进行修改。我们打开一个网站的.htaccess文件,中文是我添加的注释:

  ##

  ##如果要使用复定向模块,这个选项必须是On

  # if you want to use mod_rewrite, set this 'On'

  RewriteEngine On

  # the path to your site installation

  RewriteBase /

  # Maintenance Section - Uncomment the lines below according to your need

  # Write below your client IP address (e.g.: 127.0.0.1)

  # if you need to keep your web access during maintenance

  #RewriteCond %{REMOTE_ADDR} !^127.0.0.1$

  # Choose your way of closing the access to PMF:

  # a. you can simply forbid access (HTTP 403 Error)

  #RewriteRule ^(.*)$ underMaintenance.htm [F,L]

  # b. return the user an explanation

  #RewriteRule ^(.*)$ underMaintenance.htm [L]

  ##将所有不带3w的网址,转为带3w的规范网址。重定向代码须要写在所有的代码前面。

  # url canonicalization

  RewriteCond %{http_host} ^abcde.com [NC]

  RewriteRule ^(.*)$ http://www.abcde.com/$1 [L,R=301]

  ##404错误页面

  # 404 page

  ErrorDocument 404 /404.html

  使用301注意一点:HTML静态页面不支持。接下来看看在PHP中如何做301重定向代码:

  Header(“HTTP/1.1 301 Moved Permanently”);

  Header(“Location:http://www.domain.com”);

  将上面的两行代码加到PHP代码中即可。

  301重定向,还有以下用途:

  l 多个域名如.cn,.net,.org,.cc等全部转向主域名.com。

  l Domaina123b123c123d123e123.com可以转来短域名:doabcde.com

  l 网站改版、URL命名系统改变。

  l 动态化的URL转静态化的URL。

  以上介绍了不规范网址产生的原因、处理方法,随着搜索引擎算法的更变,SEO的方法也不断更新。不担保所做的操作百分百有效。本文仅供SEO技术上交流使用。作者码字截图很辛苦,转载请保留作者及链接,万分谢意!

  SEO专题推荐:

  关键词优化专题:网站关键词优化没效果?来这里学习最实用的关键词优化技巧!

  内链优化专题:最能提升网站权重的内链部署优化技巧与方法

  外链建设专题:高质量自然外链怎么做?读完这些你将质的飞跃

  网站降权专题:2015年最有用的网站降权、被K、被黑、被攻击的解决方法

  用户体验专题:学习完这些,作为站长的你可以秒懂如何做网站用户体验

  行业网站专题:优化行业网站的“葵花宝典”看完后无优化压力

三 : 网站优化之网址URL规范化

  刚刚在谷歌网站管理员中心博客上看到一则邮件:是关于他们对新的规范链接标签的支持。

  这个标签也得到了雅虎和微软的认可。规范链接标签告诉了搜索引擎一个页面的首选URL应该是什么样地。

  如海阔天空科技网站,网站建设栏目看起来应该像这样

  而不是这样的:http:// www.infoah.com/page.php?item=swedish-fish&trackingid=1234&sessionid=5678

  对于网站来说这是非常有用的,由于变量它可以有一种页面的多个版本,如跟踪参数或会话ID。另一个好处是,PR值是通过规范的URL来测量的。

  网址不规化很容易引起网站重复内容,搜索引擎在决定哪个页面将最终出现在搜索结果队列之前会花费一定的时间来收集一个页面比另一个好的证据。而“可能包含重复内容”的页面将不会出现在排序中。

  网站建设之网站优化,其中网址URL规范显示,尽管这里很有可能出现重复内容,但规范标签在这里并不很有效,因为它要求很多手动的检查。建议用meta noindex的标签将显得更为有效。

  SEO专题推荐:

  关键词优化专题:网站关键词优化没效果?来这里学习最实用的关键词优化技巧!

  内链优化专题:最能提升网站权重的内链部署优化技巧与方法

  外链建设专题:高质量自然外链怎么做?读完这些你将质的飞跃

  网站降权专题:2015年最有用的网站降权、被K、被黑、被攻击的解决方法

  用户体验专题:学习完这些,作为站长的你可以秒懂如何做网站用户体验

  行业网站专题:优化行业网站的“葵花宝典”看完后无优化压力

本文标题:网站优化-多语言网站优化和hreflang标签
本文地址: http://www.61k.com/1189188.html

61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1