Nginx Log日志统计分析常用命令
nginx日志分析对于线上业务排错有很大的帮助,运用合适的命令能够快速、准确定位出问题。主要涉及awk、sort、uniq这三个命令的使用。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 1sort
2参 数:
3 -b 忽略每行前面开始出的空格字符。
4 -c 检查文件是否已经按照顺序排序。
5 -d 排序时,处理英文字母、数字及空格字符外,忽略其他的字符。
6 -f 排序时,将小写字母视为大写字母。
7 -i 排序时,除了040至176之间的ASCII字符外,忽略其他的字符。
8 -m 将几个排序好的文件进行合并。
9 -M 将前面3个字母依照月份的缩写进行排序。
10 -n 依照数值的大小排序。
11 -o<输出文件> 将排序后的结果存入指定的文件。
12 -r 以相反的顺序来排序。
13 -t<分隔字符> 指定排序时所用的栏位分隔字符。
14 +<起始栏位>-<结束栏位> 以指定的栏位来排序,范围由起始栏位到结束栏位的前一栏位。
15 --help 显示帮助。
16 --version 显示版本信息
17
18
1
2
3
4
5
6
7 1 [root@www ~]# uniq [-icu]
2选项与参数:
3-i :忽略大小写字符的不同;
4-c :进行计数
5-u :只显示唯一的行
6
7
使用taif -f命令查看最新日志内容
1
2
3 1tail -f ***.log
2
3
0,对日志的统计
1).根据访问IP统计UV
1
2
3 1awk '{print $1}' access.log|sort | uniq -c |wc -l
2
3
2).统计访问URL统计PV
1
2
3 1awk '{print $7}' access.log|wc -l
2
3
3).查询访问最频繁的URL
1
2
3 1awk '{print $7}' access.log|sort | uniq -c |sort -n -k 1 -r|more
2
3
4).查询访问最频繁的IP
1
2
3 1awk '{print $1}' access.log|sort | uniq -c |sort -n -k 1 -r|more
2
3
5).根据时间段统计查看日志
1
2
3 1 cat access.log| sed -n '/14\/Mar\/2018:21/,/14\/Mar\/2018:22/p'|more
2
3
1.IP相关统计
1.1 统计IP访问量(独立ip访问数量)
1
2
3 1awk '{print $1}' access.log | sort -n | uniq | wc -l
2
3
1.2 查看某一时间段的IP访问量(4-5点)
1
2
3 1grep "07/Apr/2017:0[4-5]" access.log | awk '{print $1}' | sort | uniq -c| sort -nr | wc -l
2
3
1.3 查看访问最频繁的前100个IP
1
2
3 1awk '{print $1}' access.log | sort -n |uniq -c | sort -rn | head -n 100
2
3
1.4 查看访问100次以上的IP
1
2
3 1awk '{print $1}' access.log | sort -n |uniq -c |awk '{if($1 >100) print $0}'|sort -rn
2
3
1.5 查询某个IP的详细访问情况,按访问频率排序
1
2
3 1grep '127.0.01' access.log |awk '{print $7}'|sort |uniq -c |sort -rn |head -n 100
2
3
2.页面访问统计
2.1 查看访问最频的页面(TOP100)
1
2
3 1awk '{print $7}' access.log | sort |uniq -c | sort -rn | head -n 100
2
3
2.2 查看访问最频的页面([排除php页面】(TOP100)
1
2
3 1grep -v ".php" access.log | awk '{print $7}' | sort |uniq -c | sort -rn | head -n 100
2
3
2.3 查看页面访问次数超过100次的页面
1
2
3 1cat access.log | cut -d ' ' -f 7 | sort |uniq -c | awk '{if ($1 > 100) print $0}' | less
2
3
2.4 查看最近1000条记录,访问量最高的页面
1
2
3 1tail -1000 access.log |awk '{print $7}'|sort|uniq -c|sort -nr|less
2
3
3.每秒每分钟每小时请求量统计
3.1 统计每秒的请求数,top100的时间点(精确到秒)
1
2
3 1awk '{print $4}' access.log |cut -c 14-21|sort|uniq -c|sort -nr|head -n 100
2
3
3.2 统计每分钟的请求数,top100的时间点(精确到分钟)
1
2
3 1awk '{print $4}' access.log |cut -c 14-18|sort|uniq -c|sort -nr|head -n 100
2
3
3.3 每小时的请求数,top100的时间点(精确到小时)
1
2
3 1awk '{print $4}' access.log |cut -c 14-15|sort|uniq -c|sort -nr|head -n 100
2
3
4.性能分析
在nginx log中最后一个字段加入$request_time
4.1 列出传输时间超过 3 秒的页面,显示前20条
1
2
3 1cat access.log|awk '($NF > 3){print $7}'|sort -n|uniq -c|sort -nr|head -20
2
3
4.2 列出php页面请求时间超过3秒的页面,并统计其出现的次数,显示前100条
1
2
3 1cat access.log|awk '($NF > 1 && $7~/\.php/){print $7}'|sort -n|uniq -c|sort -nr|head -100
2
3
5.蜘蛛抓取统计
5.1 统计蜘蛛抓取次数
1
2
3 1grep 'Baiduspider' access.log |wc -l
2
3
5.2 统计蜘蛛抓取404的次数
1
2
3 1grep 'Baiduspider' access.log |grep '404' | wc -l
2
3
6.TCP连接统计
6.1 查看当前TCP连接数
1
2
3 1netstat -tan | grep "ESTABLISHED" | grep ":80" | wc -l
2
3
6.2 用tcpdump嗅探80端口的访问看看谁最高
1
2
3 1tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F"." '{print $1"."$2"."$3"."$4}' | sort | uniq -c | sort -nr
2
3