Tag Archives: wget

使用wget和cron自动备份网站

对于一个静态网站,在没有负载均衡的情况下。如果主机出现问题,就会影响到正常访问。而如果同时没有及时备份,会导致网站直接停止服务或只能使用以前的存档来临时提供服务。
 
所以,使用wget同步网站,同时使用cron来定时运行。可以作为一种简单的解决方法。
执行:

#crontab -e

在其中增加

8 8,13,19 * * * cd /web/bak/;wget -m -nH -np -r -p -k http://www.sxyin.com;chown -R 33.33 /web/bak/

上面的这行意思,就是在每天的8点、13点、19点的8分定时同步网站。wget的参数以前介绍过,不多说了。
 
上面这种方法只适应于静态网站。同时还有一点,wget对javascript中包含的图片似乎不能正确地下载,往往会忽略结果。所以第一次还是手动同步一次,并补全需要的文件把