缓存知识体系之-浏览器缓存
《缓存知识体系之-浏览器缓存》要点: 【上篇】前言现在我们把注意力关注到浏览器本身,那么我们要知道的是浏览器本质上是一个HTTP代理,它帮助用户发送HTTP请求给Web服务器,然后Web服务器响应请求,返回数据给浏览器,浏览器进行本地渲染展示给用户.那么浏览器能不能把Web服务器返回的网页或者图片、css、js等这些资源保存下来,下次我们再访问相同的资源的时候直接读取缓存呢? 浏览器缓存协商现在我们有两个伙伴,浏览器和Web服务器,Web服务器希望能缓存一些数据到浏览器上,但是浏览器并不知道哪些数据要缓存,哪些数据不缓存,那么他们两个就需要对话.由于我们浏览器和Web服务器本身的通信协议就是HTTP,那么是不是就可以通过HTTP来进行对话呢,我们把这个浏览器和Web服务器之间有关缓存的对话称之为“缓存协商”,虽然有点像小学课文的名词解释,但是我们现在知道了一个专业的名词-“缓存协商”. Last-Modified浏览器和Web服务器缓存协商的第一个方法是Last-Modified,也就是最后修改时间.我们知道我们的网页存放在Linux服务器上会有三个时间,我们可以使用stat来获取. 那么Web服务器默认情况下可以通过stat()系统调用获取到静态文件index.html在硬盘上的最后修改时间,而且在响应HTTP请求的时候回会为静态文件在HTTP响应头部自动生成最后修改时间.比如下面我们使用Firefox的Firebug插件来查看alidns.com(阿里提供的公共DNS). 在上面的这个图中,我们打开http://alidns.com,浏览器发送的第一个请求GET alidns.com,我们可以看到Web服务器返回200的状态码,同时在响应头中,告诉了浏览器,它这个文件的最后修改时间.好的,我们先不要着急,先来研究下这些缓存存放在哪里.对于firefox浏览器来说,是使用二进制格式保存的,不过我们可以使用about:cache来查看.直接在浏览器的地址栏输入即可. 我们可以看到firefox默认有两种缓存保存的地方,一个是内存中,一个是保存在磁盘中,还有一个是应用本身的缓存.(如果你的浏览器已经打开很久,可能需要清空缓存后,才能更快的找到刚才的alidns.com的缓存)我们现在再次刷新下页面,你可以按F5、回车键或者firefox上面的重载页面的图标. 我们再次使用firefox的firebug看看发生了什么,首先之前的返回的状态码由200变成了304.我们先看下面的请求头的信息.再第二次访问alidns.com的时候浏览器在请求头部增加了If-Modified-Since????? Fri,11Jul 2014 03:25:04 GMT的内容,意思是询问浏览器:浏览器大哥,请问下这个文件在我这个时间后有没有更改过,如果没有更改过,我就使用我本地缓存给用户呈现页面了哦.再看最上面,Web服务器非常果断的回复304,也就是这个文件在你之前保存的最后修改时间后,没有更改过,你可以使用本地缓存. 好的,我们可以看到浏览器和Web服务器协商的很愉快,对于访问我们站点的用户来说,如果之前访问过我们的网站,那么第二次打开相同的静态页面,就不会产生实际的文件传输.为我们节约了服务器的带宽,同时由于浏览器直接使用本地缓存呈现给用户,所以用户打开我们站点的速度也是非常的快. ?Etag我们现在要介绍另外一个缓存协商的方法,因为在某些场景下Last-Modified可能工作的并不愉快,比如有一种情况,我们的Web服务器上面的文件最后修改时间会频繁的变动,但是文件内容却没有修改.那么对于Last-Modified的缓存协商,每次都会重新获取文件,而不会使用缓存. 还有一种生产中比较常见的场景,比如我们在集群环境中,相同的网页可能被保存在不同的服务器上,在负载均衡的时候用户的请求会被分配到这些不同的服务器中,但是我们很难保证相同的文件在所有服务器上的最后修改时间都是一致的.那么这样用户请求被分发到时间不对的服务器上时,可能会导致浏览器会重新获取网页内容. Etag这个时候站出来勇敢的承担一切,HTTP1.1协议中并没有规定Etag的具体格式和生产的方法,总之Web服务器可以给每一个静态文件都生产一个标签,或者叫指纹,总之是一个唯一标识符(比如给文件做一个md5),当文件内容改变的时候就修改这个标签,这样浏览器和Web服务器之间就通过询问网页的Etag是否改变来进行缓存协商. 这里我不准备再次截图,读者可以自己使用firebug观察下etag的工作方式,我要强调一下就是同时存在Etag和Last-Modified的时候,Etag的优先级要高. Expires我们先回过头在看之前的两种缓存协商办法,浏览器给Web服务器发送HTTP请求来询问是否可以使用缓存.如果Web服务器告诉浏览器使用缓存,那么浏览器就直接使用缓存呈现给用户,你是否发现,这个询问的HTTP请求是不是也占用了Web服务器的资源,即便不产生任何的数据传输,用户还是需要等待这个请求发送到响应完毕.那么能不能不发送HTTP请求呢?比如第一次浏览器请求完毕后,Web服务器告诉浏览器这个网页保存1小时,你1个小时之内不要再过来烦我哦. 和Last-Modified、Etab一样我们常用的Web服务器Apache、Nginx都支持过期时间(Expires)的设置,当浏览器第一次请求资源的时候,Web服务器设置一个过期时间,那么在这段时间内,浏览器会直接使用本地缓存,而不发送任何的缓存协商.请看下面这个Nginx的配置实例: (编辑:ASP站长网) |