最近时不时有互联网的朋友问我关于服务器监控方面的问题,问常用的服务器监控除了用开源软件,比如:cacti,nagios监控外是否可以自己写shell脚本呢?根据自己的需求写出的shell脚本更能满足需求,更能细化主机监控的全面性。
下面是我常用的几个主机监控的脚本,大家可以根据自己的情况再进行修改,希望能给大家一点帮助。
1、查看主机网卡流量
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18 1
2#!/bin/bash
3#network
4#Mike.Xu
5while : ; do
6 time='date +%m"-"%d" "%k":"%M'
7 day='date +%m"-"%d'
8 rx_before='ifconfig eth0|sed -n "8"p|awk '{print $2}'|cut -c7-'
9 tx_before='ifconfig eth0|sed -n "8"p|awk '{print $6}'|cut -c7-'
10 sleep 2
11 rx_after='ifconfig eth0|sed -n "8"p|awk '{print $2}'|cut -c7-'
12 tx_after='ifconfig eth0|sed -n "8"p|awk '{print $6}'|cut -c7-'
13 rx_result=$[(rx_after-rx_before)/256]
14 tx_result=$[(tx_after-tx_before)/256]
15 echo "$time Now_In_Speed: "$rx_result"kbps Now_OUt_Speed: "$tx_result"kbps"
16 sleep 2
17done
18
2、系统状况监控
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 1
2#!/bin/sh
3#systemstat.sh
4#Mike.Xu
5IP=192.168.1.227
6top -n 2| grep "Cpu" >>./temp/cpu.txt
7free -m | grep "Mem" >> ./temp/mem.txt
8df -k | grep "sda1" >> ./temp/drive_sda1.txt
9#df -k | grep sda2 >> ./temp/drive_sda2.txt
10df -k | grep "/mnt/storage_0" >> ./temp/mnt_storage_0.txt
11df -k | grep "/mnt/storage_pic" >> ./temp/mnt_storage_pic.txt
12time=`date +%m"."%d" "%k":"%M`
13connect=`netstat -na | grep "219.238.148.30:80" | wc -l`
14echo "$time $connect" >> ./temp/connect_count.txt
15
3、监控主机的磁盘空间,当使用空间超过90%就通过发mail来发警告
1
2
3
4
5
6
7
8
9 1
2#!/bin/bash
3#monitor available disk space
4SPACE='df | sed -n '/ \ / $ / p' | gawk '{print $5}' | sed 's/%//'
5if [ $SPACE -ge 90 ]
6then
7fty89@163.com
8fi
9
4、 监控CPU和内存的使用情况
1
2
3
4
5
6
7
8
9
10
11
12
13
14 1
2#!/bin/bash
3#script to capture system statistics
4OUTFILE=/home/xu/capstats.csv
5DATE='date +%m/%d/%Y'
6TIME='date +%k:%m:%s'
7TIMEOUT='uptime'
8VMOUT='vmstat 1 2'
9 USERS='echo $TIMEOUT | gawk '{print $4}' '
10LOAD='echo $TIMEOUT | gawk '{print $9}' | sed "s/,//' '
11FREE='echo $VMOUT | sed -n '/[0-9]/p' | sed -n '2p' | gawk '{print $4} ' '
12IDLE='echo $VMOUT | sed -n '/[0-9]/p' | sed -n '2p' |gawk '{print $15}' '
13echo "$DATE,$TIME,$USERS,$LOAD,$FREE,$IDLE" >> $OUTFILE
14
5、全方位监控主机
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30 1
2#!/bin/bash
3# check_xu.sh
4# 0 * * * * /home/check_xu.sh
5
6DAT="`date +%Y%m%d`"
7HOUR="`date +%H`"
8DIR="/home/oslog/host_${DAT}/${HOUR}"
9DELAY=60
10COUNT=60
11# whether the responsible directory exist
12if ! test -d ${DIR}
13then
14 /bin/mkdir -p ${DIR}
15fi
16# general check
17export TERM=linux
18/usr/bin/top -b -d ${DELAY} -n ${COUNT} > ${DIR}/top_${DAT}.log 2>&1 &
19# cpu check
20/usr/bin/sar -u ${DELAY} ${COUNT} > ${DIR}/cpu_${DAT}.log 2>&1 &
21#/usr/bin/mpstat -P 0 ${DELAY} ${COUNT} > ${DIR}/cpu_0_${DAT}.log 2>&1 &
22#/usr/bin/mpstat -P 1 ${DELAY} ${COUNT} > ${DIR}/cpu_1_${DAT}.log 2>&1 &
23# memory check
24/usr/bin/vmstat ${DELAY} ${COUNT} > ${DIR}/vmstat_${DAT}.log 2>&1 &
25# I/O check
26/usr/bin/iostat ${DELAY} ${COUNT} > ${DIR}/iostat_${DAT}.log 2>&1 &
27# network check
28/usr/bin/sar -n DEV ${DELAY} ${COUNT} > ${DIR}/net_${DAT}.log 2>&1 &
29#/usr/bin/sar -n EDEV ${DELAY} ${COUNT} > ${DIR}/net_edev_${DAT}.log 2>&1 &
30
放在crontab里每小时自动执行:
1
2
3 1
20 * * * * /home/check_xu.sh
3
这样会在/home/oslog/host_yyyymmdd/hh目录下生成各小时cpu、内存、网络,IO的统计数据。
如果某个时间段产生问题了,就可以去看对应的日志信息,看看当时的主机性能如何。