一 : 涨知识丨Web性能优化:What?Why?How?
为什么要提升web性能?Web性能黄金准则:只有10%~20%的最终用户响应时间花在了下载html文档上,其余的80%~90%时间花在了下载页面组件上。
web性能对于用户体验有及其重要的影响,根据著名的2-5-8原则:
当用户在2秒以内得到响应,会感觉系统的响应非常快 当用户在2-5秒之内得到响应,会感觉系统的响应速度还可以 当用户在5-8秒之内得到响应,会感觉系统的响应非常慢,但还可以接受 当用户在8秒之后都没有得到响应,会感觉系统糟透了,甚至系统已经挂掉;要么打开竞争对手的网站,要么重新发起第二次请求.凡事都需要研究,通过科学的研究我们就可以找到事物的发展规律。这里要感谢雅虎的工程师总结的14条前端优化法则,使得我们可以站在巨人的肩膀上。《高性能网站建设》这本书中的14条优化原则,总结起来主要是以下个方面的优化:
减少HTTP请求 页面内部优化 启用缓存 减少下载量 网络连接上的优化 为什么减少HTTP请求可以提高Web性能?要回答这个问题,我们就要了解当浏览器向服务器发送一个http请求知道获取数据都经历哪些过程:
开启一个链接(tcp/ip的三次握手过程) -》 发送请求 -》 等待(网络延迟跟服务器的处理时间)-》 下载数据
我们看一下百度首页中的http请求在各阶段耗费的时间,上面不同的颜色代表下图中的不同阶段
可以看到除了图片之外,其余大部分http请求的事件花在了建立连接与等待阶段。
http协议建立在TIC/IP协议之上,在TCP/IP协议中,TCP协议提供可靠的连接服务,采用三次握手建立一个连接。 简单来说三次握手就是一个身份确认的过程:
(第一次握手:主机A发送位码为syn=1,随机产生seq number=1234567的数据包到服务器,主机B由SYN=1知道,A要求建立联机;)
晴儿:你是潇哥哥吗,我是晴儿
第二次握手:主机B收到请求后要确认联机信息,向A发送ack number=(主机A的seq+1),syn=1,ack=1,随机产生seq=7654321的包)
潇剑:这货是谁,一箫一剑走江湖,下一句是什么?
(第三次握手:主机A收到后检查ack number是否正确,即第一次发送的seq number+1,以及位码ack是否为1,若正确,主机A会再发送ack number=(主机B的seq+1),ack=1,主机B收到后确认seq值与ack=1则连接建立成功。)
晴儿:这首诗。。。你真的是潇哥哥,一萧一剑走江湖,千古情愁酒一回。。。
潇剑:晴儿,你真的是晴儿。。。。
(啪啪啪啪啪啪啪啪啪啪啪啪啪啪啪。。。。。。。。。。。。)
言归正传,这个过程也是需要消耗时间的,在百度首页找到一个极端的例子:
而等待的时间通常也大于内容下载的时间,这里同样找到一个极端例子:
由此我们可以得出结论:一个http请求绝大多数的时间消耗在了建立连接跟等待的时间,优化的方法是减少http请求。
如何提高web性能?1、减少HTTP请求
一般来说要减少http请求通常从两个方面下手:减少图片的请求、减少脚本文件与样式表的请求
图片的减少通常有两种方式:css sprites、内联图片、IconFont。
CSS Sprites:将多张图片合并成一幅单独的图片,使用css的background-position属性,将html元素的背景图片放到sprites 图片中的期望位置上。使用这项技术的附加优点是他降低了下载量,合并后的图片比分离的图片和更小,因为它降低了图片自身的开销(颜色表、格式信息等等)。实际项目中css sprites是一项体力活,因为开发过程中需要对这张大图进行维护(添加、减少图片),张鑫旭同学的文章中有介绍如何管理sprites图片可以作为参考(这里)。如果需要在页面中为背景、链接、导航栏提供大量的图片,css sprites绝对是一种优秀的解决方案(干净的标签、较少的图片、较短的响应时间)。
内联图片:通过使用data:URL模式可以再页面中包含图片而无需任何额外的请求。缺点就是IE8以下的浏览器不支持这种方式,而IE8在数据大小上有限制,只能支持23kb以内的数据。对于较小的图片来说可以直接内联到web页面中,但对于大图片内联到页面里会导致页面变大,聪明的做法是使用css,将内联的图片作为背景使用,并放到外部样式表中,这意味着数据可以缓存在样式表内部。使用外部样式表虽然增加了一个http请求,但样式可以被浏览器缓存,得到额外的收获。另外一点需要注意:base64是有损压缩。
IconFont:图标字体,这是近年来新流行的一种以字体代替图片的技术。它可以适应任何分辨率而不会出现图片模糊问题,与图片相比它具有更小的容量,更高的灵活性(像字体一样可以设置图标大小、颜色、透明度、hover状态、反转等),IE8以上的浏览器都支持该技术。在使用IconFont之前,你首先要确定你选则的字体库是否是收费。详细内容可以参考这篇文章:图标字体化浅谈
()
减少脚本与样式表的请求主要原则就是合并。在实际开发中我们遵循模块化的原则将代码分散到许多小文件中,按照软件开发的原则这是完全正确的,但对于上线页面来说,每一个文件都会产生一个http请求,严重影响性能。和css sprites一样,将这些小文件合并到一个文件中,可以减少http请求的数量并缩短最终用户响应时间。在合并过程中我们还需要使用工具精简(移除不必要的字符以减小文件大小缩减下载时间)和混淆(除了移除不必要字符外,还会改写源代码,比如函数和变量名使用更短的标量名)Javascript代码。对于采用AMD或CMD进行模块化开发的同学,在合并过程中通常会将依赖的其他模块打包到一个文件中,而模板html通常以字符串的方式内联到Javascript文件中。目前最常用的前端构建工具就是glup,这里有一篇初步应用的文章:前端 | gulp 打包 require.js 模块依赖
(http://segmentfault.com/a/1190000002876583)
2、页面内部优化
关于页面内部优化主要方向:样式表放在顶部、脚本文件放在底部、避免css表达式、把脚本的样式表放在外部、移除重复脚本
关心性能的工程师都希望页面能否尽快的展现在用户面前,对于页面中很多内容的页面我们都希望内容能够逐步加载,为用户提供可视化回馈。而将样式表放在底部会导致浏览器阻止内容逐步呈现。为避免当页面变化时重绘页面元素,浏览器会阻塞页面呈现,直到样式表解析完毕(详细内容可以查看我的这篇博客)。所以如果将样式表放在顶部并不会减少资源的加载时间,它减少的是页面的呈现时间。小米主页曾经犯过这样的错误:
将样式表放在底部会阻塞页面的逐步呈现,而将script文件放在页面顶部同样会阻塞页面的逐步呈现。script元素会阻塞后续内容的解析,因为script中可以同过document.write来更改页面。解决的办法就是将script标签放在页面底部。这样既可以让内容逐步呈现,也可以提高下载的并行度。如果我们确定不需要document.write那可以为script标签加上asyn属性(Ie中要加上defer)提高并行下载度。
CSS表达式是ie支持的可以用来动态更改css属性的一种方式,我们不需要了解太多,她的书写方式如下,一旦在产品中发现expression关键字就要彻底消灭。
使用外部脚本和样式这一条,我想凡是有点经验的工程师都会这么干。
移除重复脚本:这条说的主要是避免在页面中多次加入同一份Javascript代码,如果我们的开发中有依赖管理的方式比如AMD、CMD,基本不会出现这种情况。
3、启用缓存
关于缓存的使用这里介绍两套方案:expires/If-Modified-Since、Cache-Control/Etag;前者是HTTP1.0中的缓存方案,后者是HTTP1.1中缓存方案,若http头部中同时出现二者,后者的优先级更高。 If-modified-since的方式通常被称为条件Get。浏览器缓存中保存了一个文件的副本,但需要向服务器询问此副本是否可用。If-Modified-Since是浏览器将最后修改时间发送给服务器,服务器相应头中Last-Modified进行对比;若If-Modified-Since <= Last-Modified 则浏览器读取本地副本。此时响应状态为304 Not Modified, 并不在发送响应体。
Expries:虽然使用条件GET和304响应能够节省时间,但浏览器跟服务器端仍然要发送一次请求进行确认。通过明确设置副本的过期时间可以避免条件GET。当浏览器发现响应头中的expires时,会将过期时间和文件一起保存到缓存中去。在过期之前一直从缓存中读取。expires头使用一个特定的时间来指定缓存的有效期,他要求浏览器与服务器时间完全一致。而且一旦过期,服务器端配置中需要重新设顶一个过期时间。
ETag(实体标签):是服务器用于检查浏览器缓存有效性的一种机制。ETag在HTTP1.1中引入,ETag是唯一标识了一个组件的一个特定版本的字符串。唯一的格式约束是这个字符串必须使用双引号。如果浏览器要验证一个组件是否有效他会使用If-None-Match将etag字符串传送给服务器。如果ETag是匹配的,服务器端会返回304.(如果实体数据需要根据User-Agent或Accept-Language来改变时,ETag提供了更高的灵活性)。对于使用服务器集群的网站来说,从一台服务器到另一台服务器,ETag通常是无法匹配的。这是ETag的问题。而且即便同时使用If-Modified-Since和If-None-Match也并不能达到预期效果。解决方法总是有的:自定义Etag格式
Cache-Control:HTTP1.1引入了来代替Expires,它使用max-age指令来指定副本被缓存多久,该指令以秒为单位定义了一个更新窗,组件从被请求开始到现在的秒数小于设定值,则一直使用副本。避免了一次http请求。相比Expries,Cache-Control指令提供了更细粒度的控制。详细内容请看大额同学的文章:透过浏览器看HTTP缓存
4、减少下载量
减少下载量最有效的方式就是开启gzip压缩,gzip是GNU开发的一种免费格式。压缩组件通过减小http响应的大小来加快响应速度。HTTP1.1通过使用Accept-Encoding来标识支持的压缩,如果服务器看到这个标识,会使用请求头中的一种方式来压缩响应。并通过Content-Encoding来通知web客户端。很多网站会压缩html文件,实际上包括xml跟json在内的任何文本都可以压缩,但图片和pdf不应该压缩。根据经验通常可以对大于1kb或2kb的文件进行压缩。压缩通常能将响应的数据量减少70%。压缩的成本在于:服务器需要耗费额外的cpu进行压缩,客户端需要解压缩。所以需要在cpu的消耗和数据块的大小之间进行取舍。
5、优化网络连接
网络连接的优化主要有三个规则:使用CDN加速、减少DNS查找、避免重定向
CDN:CDN是地理上分布的web server的集合,用于更高效地发布内容。通常基于网络远近来选择给具体用户服务的web server。 这缩短了资源的传输响应时间,有效提高web性能。
DNS用于映射主机名和IP地址,一般一次解析需要20~120毫秒。浏览器会首先根据页面的主机名进行域名解析,在有ISP返回结果之前页面不会加载任何内容,所以减少DNS查找可以有效降低等待时间。为达到更高的性能,DNS解析通常被多级别地缓存,如由ISP或局域网维护的caching server,本地机器操作系统的缓存(如windows上的DNS Client Service),浏览器。IE的缺省DNS缓存时间为30分钟,Firefox的缺省缓冲时间是1分钟。 我们能做的是尽量减少一个页面的主机名,但要在浏览器最大并行下载数跟dns查找之间做权衡。根据雅虎的研究,最好将主机名控制在2-4个内。
重定向:将一个URL重新路由到另一个URL。重定向功能是通过301和302这两个HTTP状态码完成的,如:
浏览器自动重定向请求到Location指定的URL上,重定向的主要问题是降低了用户体验。 种最耗费资源、经常发生而很容易被忽视的重定向是URL的最后缺少/,导致自动产生结尾斜线的原因是,浏览器在进行get请求是必须指定一些路径;如果没有路径它就会简单的使用文档根。(主机缺少结尾斜线是不会发生重定向:http://www.baidu.com)缺少结尾斜线发生重定向是很多web服务器的默认行为。需要在服务器端设置方可消除。以下图片是豆瓣的一个url请求:
雅虎的14条优化规则在很长的一段时间里发挥着重要作用,随着技术的发展,单单这十四条原则已经不能够满足前端性能优化,在一些大公司出现了前端工程化这一概念。
注:相关网站建设技巧阅读请移步到建站教程频道。
二 : 网站SEO优化知识点汇总
SEO的一些基础知识网络上很多,最主要的是百度官方也给出了一个较为标准的优化样板指导,如果一点基础都没有的建议可以去多看几遍,同时百度官方所给出的优化建议也是大家老生常谈的几点、什么”Title”、”keywords”、”description”、URL 、外链建设、网站内容优化等并且也讲解得比较详细。
但是一个网站的SEO优化却被大家总结为了两大点:
1、网站内容优化
网站内容优化在一些人的眼里就是发发文章,ctrl+c、ctrl+v如此简单。
2、发外链
发外链就是大量的到处发、到处灌水或购买大把链接来提高排名甚至采用发帖机器不到一秒钟就可以发出几十万条甚至更多的链接。
在杨子看来以上两点的操作方法就是一些人说SEO简单的原因所在吧,仅此来看要杨子来总结的话就是他们仅仅停留在SEO操作那一刹那的行为动作之上,以至于有的人开口闭口都是SEO就是站内内容优化、站外链接建设如此简单。
那么SEO真的就那么简单吗?答案肯定是NO。如果真的有如此简单的话在大家网站出问题时就不会垂头丧气了,就不会今天骂百度抽风、明天骂百度来大姨妈了。
说到这里杨子就例举一个简单的案例:有一家公司网站刚刚上线不是很久,在百度收录后所展现的搜索结果description部分出现了一些乱七八糟的关键词,当时领导、老板看见了紧张得要命,我们网站上没有这些东西啊什么女人私部护理、婴儿尿布湿等等乱七八糟的产品。
老板他们根本不知道这是什么原因、这些东西又是从哪里来的,为什么会出现这些东西,根本没有一点头绪,问技术如技术不懂SEO也是一个鸟样无从得知,而对于一个颇有经验的SEOer来说这就是a piece of cake,他很清楚的知道出现这情况的来龙去脉并提出解决方案,并给出分析这样的问题长时间对平台品牌的影响有多恶劣、对用户的体验影响是多么的不好等。
以上所说的现身说法是实实在在的,出现以上的问题就需要专业的SEOer来解决,不知到大家通过以上问题的解读会对SEO有个怎样的认识,还会只认为SEO 只是发发外链,发发文章那么简单吗?如果还是这样的话说明你智商多LOW,应该多学习 、多看书来提高提高。
其实SEO项目在执行优化过程中是一项系统复杂而漫长的优化工程,在杨子理念中它是集于美学设计、市场营销学、传播学、心理学、人性学、互联网技术等多门学科的结合。
而不是大家时常所说的SEO就是发发链接、发发文章如此简单,单纯从这些表面工作看真的太肤浅了,大家应该思考发外链如何发才有效果,外链应该对网站页面如何分配,怎么样才能引爆用户自主帮你转发链接,那些平台发外链更有效果,如何保证在百度知道发的外链能成功留下并发挥优化效果直至到达流量倒入入口等等。
对于说发发文章这个动作太简单了随便大街上拉个不是傻子,只要手不残都能做,或直接买个发文章的机器就可以搞定。在很多说SEO工作就是这样简单的不管是企业老板还是一些基础从业人员心理就可能就是这样所认为的吧。
然而他们在SEO项目执行过程中遇到网站文章不收录了,为什么同一篇文章人家的收录了他的又没有收录了、怎么看起有排名了又怎么了突然又掉下去了、明明写的都是原创文章怎么就没有排名、没有流量甚至没有权重啊,为什么我天天更新原创文章就是权重没有提高、流量没有提升反而下降啊等等问题时不知道他们还会说SEO就是那么简单吗?
真不知道说SEO如此简单的人有没有扳着他的脑袋想过出现这些问题的原因、有没有多问自己几次"WHY"。
SEO项目在执行中会遇到形形色色的事故,在事故中得考验我们解决问题的能力及善于发现问题的能力,更重要的是SEO项目执行中要具有一定的SEO思维创新、创意的能力,要具有一定的SEO营销策划思维能力,对于这点非常重要。
因此与其说SEO是一门技术、还不如将SEO说成是一门艺术、一种以人为本、以用户为本的创新、创意的营销思维模型,说到这里大家是否应该端正自身的态度来重新并深入的认识、研究SEO呢?
三 : 对SEO知识一知半解可能酿成过度优化
搜索引擎为了确定排名以及检测垃圾内容会关注大量的信号,也会对站点进行检查以确定是否有过度优化,并且会将结果表现在排名上,比如降低过度优化站点的排名。
任何不自然的行为都可能会让网站被打上过度优化的标签。以下是几个例子:
网站页面存在重复的页面标题和H1内容。如果页面上的subheading也使用了重复的关键词,或者所有指向该页面的内部链接使用了和页面标题完全相同的锚文本就很容易被视为过度优化。虽然规模不同,但这和早期优化中关键词堆砌的做法非常相似。一般来说,人们没办法通过这样的方式把内容写很自然,这对于用户、搜索引擎的审核人员以及搜索引擎算法来说都极为不合适的。
网站上有过多内容不相关的内链。例如,很多发布者知道从网站的其他页面链接到最重要页面的价值。你也能从几乎所有页面链接到网站的10个最重要页面。但如果交叉链接过多(即便已经有了25个),你还要继续的话就确实太冒险了。
只是为SEO,而不是基于用户体验制作页面。 刚刚了解关键词价值也知道长尾关键词的人极容易这样做。他们会发布大量用户基本甚至不会想要看到的文本内容,如果这么做了,他们会很快忽略。因为这些文本内容并不是想要给用户看,所以常常会写得很烂,并充斥着关键词和大量内链。有时这些内容看起来会像是发布者刻意让文本不易阅读。例如,在某个段落里有25行的文本块不是给用户看的。
优化页面时一定要小心。为了某一个或者一组特定的关键词做太多事情没准会得不偿失。让那些页面的内容更多的着眼在用户以及转化的优化上。你也许会发现这才是最佳SEO实践。
同样,当你给写手/编辑做SEO培训时也要注意。很多写手会怀着良好的愿望在文章里插入过多的关键词,但这对一般读者来说是不好的。要写好的内容,而不要给写手/编辑们太多SEO方面的任务。你不知道他们会怎样配合。
给他们你所期望的文章标题,告诉他们你想要使用的topics和sub-topics,然后让他们写。这样你会做得更容易些。
原文作者:Eric Enge 原文链接
本文标题:seo优化知识-涨知识丨Web性能优化:What?Why?How?61阅读| 精彩专题| 最新文章| 热门文章| 苏ICP备13036349号-1