在使用本日志分析工具分析一些复杂的日志时,系统可能无法识别规则,需要SEOER们手动设置参数。以此来精确分析数据。
目前IIS、Apache服务器的日志都是以空格分隔属性,例如16:18:03 GET /uploadfile/2014/0331/20140331101737487.jpg - - 117.79.152.122 Mozilla/4.0+(compatible;+BaiduImageSpider+1.0) 200 0 0,这是一个典型的IIS日志。分析工具的参数是指第几个空格,0为初始参数,在执行分析命令的时候,系统会检测,如果参数是0,则通过正则表达式来提取示例日志的参数位置。
系统在分析部分复杂日志的时候,可能参数会提取错误,需要SEOER们手动来调整参数。
2.时间
用户访问的时间,从一行日志的开始往后数,第几个空格开始是时间,参数则填几。
3.IP
用户的IP地址,从一行日志的开始往后数,第几个空格开始是IP,参数则填几。
4.URL
用户访问的文件链接,从一行日志的开始往后数,第几个空格开始是文件,文件一般是/开头,不是http://开头 ,参数则填几。
5.参数
用户访问的文件链接的参数,从一行日志的开始往后数,第几个空格开始是访问的文件链接,一般在文件后面一个就是了,参数则填几。
6.状态
用户访问页面时留下的状态码,如200 301 404 500等,从一行日志的开始往后数,第几个空格开始是状态码,参数则填几。
7.用户
用户访问文件时留下的用户名,从一行日志的开始往后数,第几个空格开始是用户名,一般就是浏览器名称,或者蜘蛛名称,参数则填几。
8.搜索
这个参数是SEOER们自己查询某个关键词,可以自己输入自己想查询的关键词,可以是404状态、或其他蜘蛛名称,也可以是其他关键词。
9.页大小
显示每次查询页面大小,这个可以根据自己电脑配置来设,页参数越大,系统需要的时间越长。