网站排名掉了?被K了?不知道原因是什么?手忙脚乱?......会手忙脚乱都证明你不懂得使用一个很重要的工具,那就是网站日志!一般就在你的网站目录下有个log.txt 或者类似格式的文件,如果是虚拟主机可以在控制面板直接看到!
当然打开以后都是代码,需要专业人士去看!其实要懂的代码真心不多,会了下面的你就知道如何去分析网站日志了!
1、蜘蛛名称先容
在网站日志中,蜘蛛名称一样平常有一下几类:百度->百度spider、谷歌 ->谷歌bot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider 。在日志中,只要搜刮以上蜘蛛名称,就可以看到该蜘蛛范例的爬取陈迹。
2、蜘蛛爬取返回范例
在蜘蛛爬取后会返回代码,通过查察贷款状态可以看到爬取结果,重要HTTP状态码有一下几类:
(1)200代码,表现蜘蛛爬取正常。
(2)304代码,表现自从前次抓取后,该内容没有更新。一样平常情况下,网站的图片经常会返回该值。
(3)404代码,访问的这个链接是错误链接。这个错误链接,一方面来自本来存在厥后删除了网页,另一方面大概来自原来就不存在,但其他人外链了这么个死链接。
(4)302代码,表现暂时重定向。
(5)301代码,表现永世重定向。
(6)500代码,表现步调有错。
3、日志代码解读
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2013-12-22 16:00:39
#Fields: date time s-sitename s-computername s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs-version cs(User-Agent) cs(Cookie) cs(Referer) cs-host sc-status sc-substatus sc-win32-status sc-bytes cs-bytes time-taken
date表现记录访问日期;
time访问时间;
s-sitename表现你的假造主机的代称。
s-ip访问者IP;
cs-method表现访问要领,常见的有两种,一是GET,就是平常我们打开一个 URL访问的举措,二是POST,提交表单时的举措;
cs-uri-stem就是访问哪一个文件;
cs-uri-query是指访问地点的附带参数,如asp文件?反面的字符串id=12等等,假如没有参数则用-表现;
s-port 访问的端口;
cs-username 访问者名称;
c-ip 泉源ip;
cs(User-Agent)访问泉源;
sc-status状态,200表现乐成,403表现没有权限,404表现打不到该页面,500表现步调有错;
sc-substatus 服务端传送到客户端的字节巨细;
cs–win32-statu客户端传送到服务端的字节巨细;
具体案例阐发:
2013-12-22 18:47:12 W3SVC D-901195C886694 119.147.151.150 GET /a.aspx id=2230&TypeId=91 80 - 123.125.71.28 /search/spider.html) - - 200 0 0 59004 243 2250
这段日志表现,百度spider:表现蜘蛛爬取范例为百度蜘蛛,GET /a.aspx id=2230&TypeId=91表现蜘蛛爬取文件名为a.aspx id=2230&TypeId=91。返回结果为200。
以上就是网站日志的代码大全,你学会了吗?整理不易,顺手关注~