第一章 Shell概述
第2章 Shell解析器
(1)Linux提供的Shell解析器有:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 1> [atguigu\@hadoop101 \~]\$ cat /etc/shells
2
3> /bin/sh
4
5> /bin/bash
6
7> /sbin/nologin
8
9> /bin/dash
10
11> /bin/tcsh
12
13> /bin/csh
14
15
(2)bash和sh的关系
1
2
3
4
5
6
7 1> [atguigu\@hadoop101 bin]\$ ll \| grep bash
2
3> \-rwxr-xr-x. 1 root root 941880 5月 11 2016 bash
4
5> lrwxrwxrwx. 1 root root 4 5月 27 2017 sh -\> bash
6
7
(3)Centos默认的解析器是bash
1
2
3
4
5 1> [atguigu\@hadoop102 bin]\$ echo \$SHELL
2
3> /bin/bash
4
5
第3章 Shell脚本入门
1.脚本格式
脚本以\#!/bin/bash开头(指定解析器)
2.第一个Shell脚本:helloworld
(1)需求:创建一个Shell脚本,输出helloworld
(2)案例实操:
1
2
3
4
5
6
7
8
9
10 1> [atguigu\@hadoop101 datas]\$ touch helloworld.sh
2
3> [atguigu\@hadoop101 datas]\$ vi helloworld.sh
4
5在helloworld.sh中输入如下内容
6
7#!/bin/bash
8echo "helloworld"
9
10
(3)脚本的常用执行方式
第一种:采用bash或sh+脚本的相对路径或绝对路径(不用赋予脚本+x权限)
sh+脚本的相对路径
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ sh helloworld.sh
2
3> Helloworld
4
5
sh+脚本的绝对路径
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ sh /home/atguigu/datas/helloworld.sh
2
3> helloworld
4
5
bash+脚本的相对路径
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ bash helloworld.sh
2
3> Helloworld
4
5
bash+脚本的绝对路径
1
2
3
4 1> [atguigu\@hadoop101 datas]\$ bash /home/atguigu/datas/helloworld.sh
2> Helloworld
3
4
第二种:采用输入脚本的绝对路径或相对路径执行脚本(必须具有可执行权限+x)
(a)首先要赋予helloworld.sh 脚本的+x权限
1
2
3 1> [atguigu\@hadoop101 datas]\$ chmod 777 helloworld.sh
2
3
(b)执行脚本
相对路径
1
2
3 1> [atguigu\@hadoop101 datas]\$ ./helloworld.sh
2
3
Helloworld绝对路径
1
2
3
4 1> [atguigu\@hadoop101 datas]\$ /home/atguigu/datas/helloworld.sh
2 Helloworld
3
4
注意:第一种执行方法,本质是bash解析器帮你执行脚本,所以脚本本身不需要执行权限。第二种执行方法,本质是脚本需要自己执行,所以需要执行权限。
3.第二个Shell脚本:多命令处理
(1)需求:
在/home/atguigu/目录下创建一个banzhang.txt,在banzhang.txt文件中增加“I love cls”。
(2)案例实操:
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ touch batch.sh
2
3> [atguigu\@hadoop101 datas]\$ vi batch.sh
4
5
在batch.sh中输入如下内容
1
2
3
4
5
6 1#!/bin/bash
2cd /home/atguigu
3touch cls.txt
4echo "I love cls" \>\>cls.txt
5
6
第4章 Shell中的变量
4.1 系统变量
- 常用系统变量
$HOME、$PWD、$SHELL、$USER等
2.案例实操
(1)查看系统变量的值
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ echo \$HOME
2
3> /home/atguigu
4
5
(2)显示当前Shell中所有变量:set
1
2
3
4
5
6
7
8
9
10
11 1> [atguigu\@hadoop101 datas]\$ set
2
3> BASH=/bin/bash
4
5> BASH_ALIASES=()
6
7> BASH_ARGC=()
8
9> BASH_ARGV=()
10
11
4.2 自定义变量
1.基本语法
(1)定义变量:变量=值
(2)撤销变量:unset 变量
(3)声明静态变量:readonly变量,注意:不能unset
2.变量定义规则
(1)变量名称可以由字母、数字和下划线组成,但是不能以数字开头,环境变量名建议大写。
(2)等号两侧不能有空格
(3)在bash中,变量默认类型都是字符串类型,无法直接进行数值运算。
(4)变量的值如果有空格,需要使用双引号或单引号括起来。
3.案例实操
(1)定义变量A
1
2
3
4
5
6
7 1> [atguigu\@hadoop101 datas]\$ A=5
2
3> [atguigu\@hadoop101 datas]\$ echo \$A
4
5> 5
6
7
(2)给变量A重新赋值
1
2
3
4
5
6
7 1> [atguigu\@hadoop101 datas]\$ A=8
2
3> [atguigu\@hadoop101 datas]\$ echo \$A
4
5> 8
6
7
(3)撤销变量A
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ unset A
2
3> [atguigu\@hadoop101 datas]\$ echo \$A
4
5
(4)声明静态的变量B=2,不能unset
1
2
3
4
5
6
7
8
9
10
11 1> [atguigu\@hadoop101 datas]\$ readonly B=2
2
3> [atguigu\@hadoop101 datas]\$ echo \$B
4
5> 2
6
7> [atguigu\@hadoop101 datas]\$ B=9
8
9> \-bash: B: readonly variable
10
11
(5)在bash中,变量默认类型都是字符串类型,无法直接进行数值运算
[atguigu@hadoop102 ~]$ C=1+2
[atguigu@hadoop102 ~]$ echo $C
1+2
(6)变量的值如果有空格,需要使用双引号或单引号括起来
1
2
3
4
5
6
7
8
9
10
11 1> [atguigu\@hadoop102 \~]\$ D=I love banzhang
2
3> \-bash: world: command not found
4
5> [atguigu\@hadoop102 \~]\$ D="I love banzhang"
6
7> [atguigu\@hadoop102 \~]\$ echo \$A
8
9> I love banzhang
10
11
(7)可把变量提升为全局环境变量,可供其他Shell程序使用
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 1> export 变量名
2
3> [atguigu\@hadoop101 datas]\$ vim helloworld.sh
4
5> 在helloworld.sh文件中增加echo \$B
6
7#!/bin/bash
8
9echo "helloworld"
10
11echo \$B
12
13> [atguigu\@hadoop101 datas]\$ ./helloworld.sh
14
15> Helloworld
16
17
发现并没有打印输出变量B的值。
1
2
3
4
5
6
7
8
9 1> [atguigu\@hadoop101 datas]\$ export B
2
3> [atguigu\@hadoop101 datas]\$ ./helloworld.sh
4
5> helloworld
6
7> 2
8
9
4.3 特殊变量:$n
1.基本语法
1
2
3 1\$n
2
3
(功能描述:n为数字,$0代表该脚本名称,$1-$9代表第一到第九个参数,十以上的参数,十以上的参数需要用大括号包含,如${10})
2.案例实操
(1)输出该脚本文件名称、输入参数1和输入参数2 的值
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ touch parameter.sh
2
3> [atguigu\@hadoop101 datas]\$ vim parameter.sh
4
5
1
2
3
4
5 1#!/bin/bash
2
3echo "\$0 \$1 \$2"
4
5
1
2
3
4
5
6
7 1> [atguigu\@hadoop101 datas]\$ chmod 777 parameter.sh
2
3> [atguigu\@hadoop101 datas]\$ ./parameter.sh cls xz
4
5> ./parameter.sh cls xz
6
7
4.4 特殊变量:$#
1.基本语法
$\# (功能描述:获取所有输入参数个数,常用于循环)。
2.案例实操
(1)获取输入参数的个数
1
2
3 1> [atguigu\@hadoop101 datas]\$ vim parameter.sh
2
3
1
2
3
4
5 1#!/bin/bash
2echo "\$0 \$1 \$2"
3echo \$\#
4
5
1
2
3
4
5
6 1> [atguigu\@hadoop101 datas]\$ chmod 777 parameter.sh
2> [atguigu\@hadoop101 datas]\$ ./parameter.sh cls xz
3> parameter.sh cls xz
4> 2
5
6
4.5 特殊变量:$*、$@
1.基本语法
$\* (功能描述:这个变量代表命令行中所有的参数,$*把所有的参数看成一个整体)
$@ (功能描述:这个变量也代表命令行中所有的参数,不过$@把每个参数区分对待)
2.案例实操
(1)打印输入的所有参数
1
2
3 1> [atguigu\@hadoop101 datas]\$ vim parameter.sh
2
3
1
2
3
4
5
6
7 1#!/bin/bash
2echo "\$0 \$1 \$2"
3echo \$\#
4echo \$\*
5echo \$\@
6
7
1
2
3 1> [atguigu\@hadoop101 datas]\$ bash parameter.sh 1 2 3
2
3
1
2
3
4
5
6 1> parameter.sh 1 2
2> 3
3> 1 2 3
4> 1 2 3
5
6
4.6 特殊变量:$?
1.基本语法
1
2
3 1\$?
2
3
(功能描述:最后一次执行的命令的返回状态。如果这个变量的值为0,证明上一个命令正确执行;如果这个变量的值为非0(具体是哪个数,由命令自己来决定),则证明上一个命令执行不正确了。)
2.案例实操
(1)判断helloworld.sh脚本是否正确执行
1
2
3
4
5
6 1> [atguigu\@hadoop101 datas]\$ ./helloworld.sh
2> hello world
3> [atguigu\@hadoop101 datas]\$ echo \$?
4> 0
5
6
第5章 运算符
1.基本语法
1
2
3
4
5 1(1)“\$((运算式))”或“\$[运算式]”
2
3(2)expr + , - , \\\*, /, % 加,减,乘,除,取余
4
5
注意:expr运算符间要有空格
2.案例实操:
(1)计算3+2的值
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ expr 2 + 3
2
3> 5
4
5
(2)计算3-2的值
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ expr 3 - 2
2
3> 1
4
5
(3)计算(2+3)X4的值
(a)expr一步完成计算
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ expr \`expr 2 + 3\` \\\* 4
2
3> 20
4
5
(b)采用$[运算式]方式
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\# S=\$[(2+3)\*4]
2
3> [atguigu\@hadoop101 datas]\# echo \$S
4
5
第6章 条件判断
1.基本语法
[ condition ](注意condition前后要有空格)
注意:条件非空即为true,[ atguigu ]返回true,[] 返回false。
- 常用判断条件
(1)两个整数之间比较
1
2
3
4
5
6
7
8
9 1> = 字符串比较
2> \-lt 小于(less than) -le 小于等于(less equal)
3> \-eq 等于(equal) -gt 大于(greater than)
4> \-ge 大于等于(greater equal) -ne 不等于(Not equal)
5> (2)按照文件权限进行判断
6> \-r 有读的权限(read) -w 有写的权限(write)
7> \-x 有执行的权限(execute)
8
9
(3)按照文件类型进行判断
1
2
3
4 1> \-f 文件存在并且是一个常规的文件(file)
2> \-e 文件存在(existence) -d 文件存在并是一个目录(directory)
3
4
3.案例实操
(1)23是否大于等于22
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ [ 23 -ge 22 ]
2> [atguigu\@hadoop101 datas]\$ echo \$?
3> 0
4
5
(2)helloworld.sh是否具有写权限
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ [ -w helloworld.sh ]
2> [atguigu\@hadoop101 datas]\$ echo \$?
3> 0
4
5
(3)/home/atguigu/cls.txt目录中的文件是否存在
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ [ -e /home/atguigu/cls.txt ]
2> [atguigu\@hadoop101 datas]\$ echo \$?
3> 1
4
5
(4)多条件判断(&& 表示前一条命令执行成功时,才执行后一条命令,||
表示上一条命令执行失败后,才执行下一条命令)
1
2
3
4
5
6 1> [atguigu\@hadoop101 \~]\$ [ condition ] && echo OK \|\| echo notok
2> OK
3> [atguigu\@hadoop101 datas]\$ [ condition ] && [ ] \|\| echo notok
4> notok
5
6
第7章 流程控制(重点)
7.1 if 判断
1.基本语法
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15 1> if [ 条件判断式 ];then
2> 程序
3> fi
4> 或者
5> if [ 条件判断式 ]
6> then
7> 程序
8> elif [ 条件判断式 ]
9> then
10> 程序
11> else
12> 程序
13> fi
14
15
注意事项:
(1)[ 条件判断式 ],中括号和条件判断式之间必须有空格
(2)if后要有空格
2.案例实操
(1)输入一个数字,如果是1,则输出banzhang zhen shuai,如果是2,则输出cls zhen
mei,如果是其它,什么也不输出。
1
2
3
4 1> [atguigu\@hadoop101 datas]\$ touch if.sh
2> [atguigu\@hadoop101 datas]\$ vim if.sh
3
4
1
2
3
4
5
6
7
8
9
10 1#!/bin/bash
2if [ \$1 -eq "1" ]
3then
4echo "banzhang zhen shuai"
5elif [ \$1 -eq "2" ]
6then
7echo "cls zhen mei"
8fi
9
10
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ chmod 777 if.sh
2> [atguigu\@hadoop101 datas]\$ ./if.sh 1
3> banzhang zhen shuai
4
5
7.2 case 语句
1.基本语法
1
2
3
4
5
6
7
8
9
10
11
12
13
14 1> case \$变量名 in
2> "值1")
3> 如果变量的值等于值1,则执行程序1
4> ;;
5> "值2")
6> 如果变量的值等于值2,则执行程序2
7> ;;
8> …省略其他分支…
9> \*)
10如果变量的值都不是以上的值,则执行此程序
11;;
12esac
13
14
注意事项:
case行尾必须为单词“in”,每一个模式匹配必须以右括号“)”结束。
双分号“;;”表示命令序列结束,相当于java中的break。
最后的“*)”表示默认模式,相当于java中的default。
2.案例实操
(1)输入一个数字,如果是1,则输出banzhang,如果是2,则输出cls,如果是其它,输出renyao。
1
2
3
4 1> [atguigu\@hadoop101 datas]\$ touch case.sh
2> [atguigu\@hadoop101 datas]\$ vim case.sh
3
4
1
2
3
4
5
6
7
8
9
10
11
12
13
14 1!/bin/bash
2case \$1 in
3"1")
4echo "banzhang"
5;;
6"2")
7echo "cls"
8 ;;
9\*)
10echo "renyao"
11;;
12esac
13
14
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ chmod 777 case.sh
2> [atguigu\@hadoop101 datas]\$ ./case.sh 1
3> 1
4
5
7.3 for 循环
1.基本语法1
1
2
3 1for (( 初始值;循环控制条件;变量变化 ))
2
3
1
2
3
4
5 1> do
2> 程序
3> done
4
5
2.案例实操
(1)从1加到100
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ touch for1.sh
2
3> [atguigu\@hadoop101 datas]\$ vim for1.sh
4
5
1
2
3
4
5
6
7
8
9 1#!/bin/bash
2s=0
3for((i=0;i\<=100;i++))
4do
5s=\$[\$s+\$i]
6done
7echo \$s
8
9
1
2
3
4
5 1> [atguigu\@hadoop101 datas]\$ chmod 777 for1.sh
2> [atguigu\@hadoop101 datas]\$ ./for1.sh
3> “5050”
4
5
3.基本语法2
1
2
3
4
5
6 1> for 变量 in 值1 值2 值3…
2> do
3> 程序
4> done
5
6
4.案例实操
(1)打印所有输入参数
1
2
3
4 1> [atguigu\@hadoop101 datas]\$ touch for2.sh
2> [atguigu\@hadoop101 datas]\$ vim for2.sh
3
4
1
2
3
4
5
6
7
8 1#!/bin/bash
2\#打印数字
3for i in \$\*
4do
5echo "ban zhang love \$i "
6done
7
8
1
2
3
4
5
6
7 1> [atguigu\@hadoop101 datas]\$ chmod 777 for2.sh
2> [atguigu\@hadoop101 datas]\$ bash for2.sh cls xz bd
3> ban zhang love cls
4> ban zhang love xz
5> ban zhang love bd
6
7
1
2
3
4
5 1(2)比较\$\*和\$\@区别
2
3(a)\$\*和\$\@都表示传递给函数或脚本的所有参数,不被双引号“”包含时,都以\$1 \$2…\$n的形式输出所有参数。
4
5
1
2
3
4 1[atguigu@hadoop101 datas]$ touch for.sh
2[atguigu@hadoop101 datas]$ vim for.sh
3
4
1
2
3
4
5
6
7
8
9
10
11 1#!/bin/bash
2for i in $*
3do
4 echo "ban zhang love $i "
5done
6for j in $@
7do
8 echo "ban zhang love $j"
9done
10
11
1
2
3
4
5
6
7
8
9 1[atguigu@hadoop101 datas]$ bash for.sh cls xz bd
2ban zhang love cls
3ban zhang love xz
4ban zhang love bd
5ban zhang love cls
6ban zhang love xz
7ban zhang love bd
8
9
(b)当它们被双引号“”包含时,“$*”会将所有的参数作为一个整体,以“$1 $2…$n”的形式输出所有参数;“$@”会将各个参数分开,以“$1”“$2”…”$n”的形式输出所有参数。
1
2
3 1[atguigu@hadoop101 datas]$ vim for.sh
2
3
1
2
3
4
5
6
7
8
9
10
11
12
13 1#!/bin/bash
2for i in "$*"
3#$*中的所有参数看成是一个整体,所以这个for循环只会循环一次
4 do
5 echo "ban zhang love $i"
6 done
7for j in "$@"
8#$@中的每个参数都看成是独立的,所以“$@”中有几个参数,就会循环几次
9 do
10 echo "ban zhang love $j"
11done
12
13
1
2
3
4
5
6
7
8 1[atguigu@hadoop101 datas]$ chmod 777 for.sh
2[atguigu@hadoop101 datas]$ bash for.sh cls xz bd
3ban zhang love cls xz bd
4ban zhang love cls
5ban zhang love xz
6ban zhang love bd
7
8
7.4 while 循环
1.基本语法
1
2
3
4
5
6 1while [ 条件判断式 ]
2 do
3 程序
4 done
5
6
2.案例实操
(1)从1加到100
1
2
3
4 1[atguigu@hadoop101 datas]$ touch while.sh
2[atguigu@hadoop101 datas]$ vim while.sh
3
4
1
2
3
4
5
6
7
8
9
10
11
12 1#!/bin/bash
2s=0
3i=1
4while [ $i -le 100 ]
5do
6 s=$[$s+$i]
7 i=$[$i+1]
8done
9
10echo $s
11
12
1
2
3
4
5 1[atguigu@hadoop101 datas]$ chmod 777 while.sh
2[atguigu@hadoop101 datas]$ ./while.sh
35050
4
5
第8章 read读取控制台输入
1.基本语法
1
2
3
4
5
6
7
8 1read(选项)(参数)
2 选项:
3-p:指定读取值时的提示符;
4-t:指定读取值时等待的时间(秒)。
5参数
6 变量:指定读取值的变量名
7
8
2.案例实操
(1)提示7秒内,读取控制台输入的名称
1
2
3
4 1[atguigu@hadoop101 datas]$ touch read.sh
2[atguigu@hadoop101 datas]$ vim read.sh
3
4
1
2
3
4
5 1#!/bin/bash
2read -t 7 -p "Enter your name in 7 seconds " NAME
3echo $NAME
4
5
1
2
3
4
5 1[atguigu@hadoop101 datas]$ ./read.sh
2Enter your name in 7 seconds xiaoze
3xiaoze
4
5
第9章 函数
9.1 系统函数
1.basename基本语法
1
2
3
4
5 1basename [string / pathname] [suffix] (功能描述:basename命令会删掉所有的前缀包括最后一个(‘/’)字符,然后将字符串显示出来。
2选项:
3suffix为后缀,如果suffix被指定了,basename会将pathname或string中的suffix去掉。
4
5
2.案例实操
(1)截取该/home/atguigu/banzhang.txt路径的文件名称
1
2
3
4
5
6 1[atguigu@hadoop101 datas]$ basename /home/atguigu/banzhang.txt
2banzhang.txt
3[atguigu@hadoop101 datas]$ basename /home/atguigu/banzhang.txt .txt
4banzhang
5
6
- dirname基本语法
dirname 文件绝对路径
(功能描述:从给定的包含绝对路径的文件名中去除文件名(非目录的部分),然后返回剩下的路径(目录的部分))
4.案例实操
(1)获取banzhang.txt文件的路径
1
2
3
4 1> [atguigu\@hadoop101 \~]\$ dirname /home/atguigu/banzhang.txt
2> /home/atguigu
3
4
9.2 自定义函数
1.基本语法
1
2
3
4
5
6
7
8 1[ function ] funname[()]
2{
3 Action;
4 [return int;]
5}
6funname
7
8
2.经验技巧
(1)必须在调用函数地方之前,先声明函数,shell脚本是逐行运行。不会像其它语言一样先编译。
(2)函数返回值,只能通过$?系统变量获得,可以显示加:return返回,如果不加,将以最后一条命令运行结果,作为返回值。return后跟数值n(0-255)
3.案例实操
(1)计算两个输入参数的和
1
2
3
4 1[atguigu@hadoop101 datas]$ touch fun.sh
2[atguigu@hadoop101 datas]$ vim fun.sh
3
4
1
2
3
4
5
6
7
8
9
10
11
12
13 1#!/bin/bash
2function sum()
3{
4 s=0
5 s=$[ $1 + $2 ]
6 echo "$s"
7}
8
9read -p "Please input the number1: " n1;
10read -p "Please input the number2: " n2;
11sum $n1 $n2;
12
13
1
2
3
4
5
6
7 1[atguigu@hadoop101 datas]$ chmod 777 fun.sh
2[atguigu@hadoop101 datas]$ ./fun.sh
3Please input the number1: 2
4Please input the number2: 5
57
6
7
第10章 Shell工具(重点)
10.1 cut
cut的工作就是“剪”,具体的说就是在文件中负责剪切数据用的。cut命令从文件的每一行剪切字节、字符和字段并将这些字节、字符和字段输出。
1.基本用法
1
2
3 1cut [选项参数] filename
2
3
说明:默认分隔符是制表符
2.选项参数说明
表1-55
-f
列号,提取第几列
-d
分隔符,按照指定分隔符分割列
-c
指定具体的字符
3.案例实操
(0)数据准备
1
2
3
4
5
6
7
8
9 1[atguigu@hadoop101 datas]$ touch cut.txt
2[atguigu@hadoop101 datas]$ vim cut.txt
3dong shen
4guan zhen
5wo wo
6lai lai
7le le
8
9
(1)切割cut.txt第一列
1
2
3
4
5
6
7
8 1[atguigu@hadoop101 datas]$ cut -d " " -f 1 cut.txt
2dong
3guan
4wo
5lai
6le
7
8
(2)切割cut.txt第二、三列
1
2
3
4
5
6
7
8 1[atguigu@hadoop101 datas]$ cut -d " " -f 2,3 cut.txt
2shen
3zhen
4 wo
5 lai
6 le
7
8
(3)在cut.txt文件中切割出guan
1
2
3
4 1[atguigu@hadoop101 datas]$ cat cut.txt | grep "guan" | cut -d " " -f 1
2guan
3
4
(4)选取系统PATH变量值,第2个“:”开始后的所有路径:
1
2
3
4
5
6
7 1[atguigu@hadoop101 datas]$ echo $PATH
2/usr/lib64/qt-3.3/bin:/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/atguigu/bin
3
4[atguigu@hadoop102 datas]$ echo $PATH | cut -d: -f 2-
5/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin:/sbin:/home/atguigu/bin
6
7
(5)切割ifconfig 后打印的IP地址
1
2
3
4 1[atguigu@hadoop101 datas]$ ifconfig eth0 | grep "inet addr" | cut -d: -f 2 | cut -d" " -f1
2192.168.1.102
3
4
10.2 sed
sed是一种流编辑器,它一次处理一行内容。处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾。文件内容并没有改变,除非你使用重定向存储输出。
-
基本用法
1
2
3 1 sed [选项参数] ‘command’ filename
2
3
- 选项参数说明
表1-56
-e
直接在指令列模式上进行sed的动作编辑。
-i
直接编辑文件
- 命令功能描述
表1-57
a
新增,a的后面可以接字串,在下一行出现
d
删除
s
查找并替换
- 案例实操
(0)数据准备
1
2
3
4
5
6
7
8
9
10 1[atguigu@hadoop102 datas]$ touch sed.txt
2[atguigu@hadoop102 datas]$ vim sed.txt
3dong shen
4guan zhen
5wo wo
6lai lai
7
8le le
9
10
(1)将“mei nv”这个单词插入到sed.txt第二行下,打印。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17 1[atguigu@hadoop102 datas]$ sed '2a mei nv' sed.txt
2dong shen
3guan zhen
4mei nv
5wo wo
6lai lai
7
8le le
9[atguigu@hadoop102 datas]$ cat sed.txt
10dong shen
11guan zhen
12wo wo
13lai lai
14
15le le
16
17
注意:文件并没有改变
(2)删除sed.txt文件所有包含wo的行
1
2
3
4
5
6
7
8 1[atguigu@hadoop102 datas]$ sed '/wo/d' sed.txt
2dong shen
3guan zhen
4lai lai
5
6le le
7
8
(3)将sed.txt文件中wo替换为ni
1
2
3
4
5
6
7
8
9 1[atguigu@hadoop102 datas]$ sed 's/wo/ni/g' sed.txt
2dong shen
3guan zhen
4ni ni
5lai lai
6
7le le
8
9
注意:‘g’表示global,全部替换
(4)将sed.txt文件中的第二行删除并将wo替换为ni
1
2
3
4
5
6
7
8 1[atguigu@hadoop102 datas]$ sed -e '2d' -e 's/wo/ni/g' sed.txt
2dong shen
3ni ni
4lai lai
5
6le le
7
8
10.3 awk
一个强大的文本分析工具,把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行分析处理。
- 基本用法
awk [选项参数] ‘pattern1{action1} pattern2{action2}…’ filename
pattern:表示AWK在数据中查找的内容,就是匹配模式
action:在找到匹配内容时所执行的一系列命令
- 选项参数说明
表1-55
-F
指定输入文件折分隔符
-v
赋值一个用户定义变量
- 案例实操
(0)数据准备
1
2
3 1> [atguigu\@hadoop102 datas]\$ sudo cp /etc/passwd ./
2
3
(1)搜索passwd文件以root关键字开头的所有行,并输出该行的第7列。
1
2
3
4 1> [atguigu\@hadoop102 datas]\$ awk -F: '/\^root/{print \$7}' passwd
2> /bin/bash
3
4
(2)搜索passwd文件以root关键字开头的所有行,并输出该行的第1列和第7列,中间以“,”号分割。
1
2
3
4 1> [atguigu\@hadoop102 datas]\$ awk -F: '/\^root/{print \$1","\$7}' passwd
2> root,/bin/bash
3
4
注意:只有匹配了pattern的行才会执行action
(3)只显示/etc/passwd的第一列和第七列,以逗号分割,且在所有行前面添加列名user,shell在最后一行添加"dahaige,/bin/zuishuai"。
1
2
3
4
5
6
7
8
9
10 1> [atguigu\@hadoop102 datas]\$ awk -F : 'BEGIN{print "user, shell"} {print
2> \$1","\$7} END{print "dahaige,/bin/zuishuai"}' passwd
3> user, shell
4> root,/bin/bash
5> bin,/sbin/nologin
6> 。。。
7> atguigu,/bin/bash
8> dahaige,/bin/zuishuai
9
10
注意:BEGIN 在所有数据读取行之前执行;END 在所有数据执行之后执行。
(4)将passwd文件中的用户id增加数值1并输出
1
2
3
4
5
6
7 1> [atguigu\@hadoop102 datas]\$ awk -v i=1 -F: '{print \$3+i}' passwd
2> 1
3> 2
4> 3
5> 4
6
7
- awk的内置变量
表1-56
FILENAME
文件名
NR
已读的记录数
NF
浏览记录的域的个数(切割后,列的个数)
- 案例实操
(1)统计passwd文件名,每行的行号,每行的列数
1
2
3
4
5
6
7
8
9
10 1> [atguigu\@hadoop102 datas]\$ awk -F: '{print "filename:" FILENAME ",
2> linenumber:" NR ",columns:" NF}' passwd
3
4> filename:passwd, linenumber:1,columns:7
5
6> filename:passwd, linenumber:2,columns:7
7
8> filename:passwd, linenumber:3,columns:7
9
10
(2)切割IP
1
2
3
4
5 1> [atguigu\@hadoop102 datas]\$ ifconfig eth0 \| grep "inet addr" \| awk -F:
2> '{print \$2}' \| awk -F " " '{print \$1}'
3> 192.168.1.102
4
5
(3)查询sed.txt中空行所在的行号
1
2
3
4
5 1> [atguigu\@hadoop102 datas]\$ awk '/\^\$/{print NR}' sed.txt
2
3> 5
4
5
10.4 sort
sort命令是在Linux里非常有用,它将文件进行排序,并将排序结果标准输出。
-
基本语法
1
2
3 1> sort(选项)(参数)
2
3
表1-57
-n
依照数值的大小排序
-r
以相反的顺序来排序
-t
设置排序时所用的分隔字符
-k
指定需要排序的列
参数:指定待排序的文件列表
- 案例实操
(0)数据准备
1
2
3
4
5
6
7
8
9 1> [atguigu\@hadoop102 datas]\$ touch sort.sh
2> [atguigu\@hadoop102 datas]\$ vim sort.sh
3> bb:40:5.4
4> bd:20:4.2
5> xz:50:2.3
6> cls:10:3.5
7> ss:30:1.6
8
9
(1)按照“:”分割后的第三列倒序排序。
1
2
3
4
5
6
7
8 1> [atguigu\@hadoop102 datas]\$ sort -t : -nrk 3 sort.sh
2> bb:40:5.4
3> bd:20:4.2
4> cls:10:3.5
5> xz:50:2.3
6> ss:30:1.6
7
8
第11章 企业真实面试题
11.1 京东
1
2
3
4
5
6 1> 问题1:使用Linux命令查询file1中空行所在的行号
2> 答案:
3> [atguigu\@hadoop102 datas]\$ awk '/\^\$/{print NR}' sed.txt
4> 5
5
6
1
2
3
4
5
6
7
8
9 1> 问题2:有文件chengji.txt内容如下:
2
3> 张三 40
4
5> 李四 50
6
7> 王五 60
8
9
1
2
3
4
5
6
7
8 1使用Linux命令计算第二列的和并输出
2
3> [atguigu\@hadoop102 datas]\$ cat chengji.txt \| awk -F " " '{sum+=\$2}
4> END{print sum}'
5
6> 150
7
8
11.2 搜狐&和讯网
1
2
3
4
5
6
7
8
9 1问题1:Shell脚本里如何检查一个文件是否存在?如果不存在该如何处理?
2> \#!/bin/bash
3> if [ -f file.txt ]; then
4> echo "文件存在!"
5> else
6> echo "文件不存在!"
7> fi
8
9
11.3 新浪
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27 1问题1:用shell写一个脚本,对文本中无序的一列数字排序
2> [root\@CentOS6-2 \~]\# cat test.txt
3> 9
4> 8
5> 7
6> 6
7> 5
8> 4
9> 3
10> 2
11> 10
12> 1
13> [root\@CentOS6-2 \~]\# sort -n test.txt\|awk '{a+=\$0;print \$0}END{print
14> "SUM="a}'
15> 1
16> 2
17> 3
18> 4
19> 5
20> 6
21> 7
22> 8
23> 9
24> 10
25> SUM=55
26
27
11.3 金和网络
1
2
3
4
5
6 1问题1:请用shell脚本写出查找当前文件夹(/home)下所有的文本文件内容中包含有字符”shen”的文件名称
2> [atguigu\@hadoop102 datas]\$ grep -r "shen" /home \| cut -d ":" -f 1
3> /home/atguigu/datas/sed.txt
4> /home/atguigu/datas/cut.txt
5
6