技术开发 频道

实战.NET大规模网站架构:Web加速器

  二、SQUID简介

  SQUID 简单说来是基于UNIX下开发的为WEB应用加速的一个开源软件。SQUID已经普遍在基于nix系统下的WEB应用中使用,例如:新浪、网易都使用该软件,其中SQUID FOR WINDOWS是在WINDOWS下使用。SQUID通过哈希算法在磁盘上建立目录,将第一次请求的信息,存在指定的目录下,供其下次存取,此外SQUID也会将请求的页面信息缓存在内存中,当客户端访问某一页面时,如果内存中存在,则直接命中CACHE;如果内存中不存在,则到CACHE目录下获取,否则到后端的WEB SERVER获取。

  SQUID 特点:

  1、SQUID沿继了nix下配置的风格,可能用惯了WINDOWS的用户初次使用会有些不适。

  2、SQUID包括了一系列的配置策略,认证、访问控制、缓存设置、URL抓取、日志管理、磁盘管理、群集等。

  3、SQUID可以通过refresh_pattern策略设置请求的URL可缓存的内容,失效时间(详见文档)。

  4、缓存策略说明

  SQUID使用了LM算法,LM就是页面Header里时间(Date)和Last-Modified时间的差。Date一般是Squid从后面取页面的时间,Last-Modified 一般是页面生成时间。

  refresh_pattern 的语法是

  refresh_pattern [-i] regexp min percent max [options]

  min, max的单位是分钟,percent就是百分比。

  refresh_pattern 的算法如下:(当前时间定义为CURRENT_DATE)

  1) If ((CURRENT_DATE-DATE(就是LM里定义的时间)) < min),cache是新鲜的

  2) else if ((CURRENT_DATE-DATE) < (min + (max-min)*percent),cache是新鲜的

  3) else cache是过期的

  cache过期就需要从后面server取新鲜内容。

  常用的几个参数的意思

  override-expire

  该选项导致squid在检查Expires头部之前,先检查min值。这样,一个非零的min时间让squid返回一个未确认的cache命中,即使该响应准备过期。

  override-lastmod

  改选项导致squid在检查LM-factor百分比之前先检查min值。

  reload-into-ims

  该选项让squid在确认请求里,以no-cache指令传送一个请求。换句话说,squid在转发请求之前,对该请求增加一个If-Modified- Since头部。注意这点仅仅在目标有Last-Modified时间戳时才能工作。外面进来的请求保留no-cache指令,以便它到达原始服务器。

  一般情况可以使用 reload-into-ims。它其实是强行控制对象的超时时间,这违反了http协议的精神,但是在带宽较窄的场合,可以提高明显系统相应时间。

  关于SQUID FOR WINDOWS介绍已经很多,本文就不在赘述,详见SQUID权威手册这本书。

  在使用SQUID之前,首先要规划或确定你现有布署环境,如果你是Single Web Server 建议你在Web Server前增加一台机器做为SQUID服务器

0
相关文章