$ i=0;$ ((i++))$ echo $i1$ let i++$ echo $i2$ expr $i + 13$ echo $i2$ echo $i 1 | awk '{printf $1+$2}'3
说明:
expr之后的
$i,
+,1 之间有空格分开。如果进行乘法运算,需要对运算符进行转义,否则 Shell 会把乘号解释为通配符,导致语法错误;
awk后面的
$1和
$2分别指
$i和 1,即从左往右的第 1 个和第 2 个数。
用 Shell 的内置命令查看各个命令的类型如下:
$ type typetype is a shell builtin$ type letlet is a shell builtin$ type exprexpr is hashed (/usr/bin/expr)$ type bcbc is hashed (/usr/bin/bc)$ type awkawk is /usr/bin/awk
从上述演示可看出:
let是 Shell 内置命令,其他几个是外部命令,都在
/usr/bin目录下。而
expr和
bc因为刚用过,已经加载在内存的
hash表中。这将有利于我们理解在上一章介绍的脚本多种执行方法背后的原理。
说明:如果要查看不同命令的帮助,对于
let和
type等 Shell 内置命令,可以通过 Shell 的一个内置命令
help来查看相关帮助,而一些外部命令可以通过 Shell 的一个外部命令
man来查看帮助,用法诸如
help let,
man expr等。
#!/bin/bash# calc.shi=0;while [ $i -lt 10000 ]do ((i++))doneecho $i
说明:这里通过
while [ 条件表达式 ]; do .... done循环来实现。
-lt是小于号
<,具体见
test命令的用法:
man test。
如何执行该脚本?
办法一:直接把脚本文件当成子 Shell (Bash)的一个参数传入
$ bash calc.sh$ type bashbash is hashed (/bin/bash)
办法二:是通过
bash的内置命令
.或
source执行
$ . ./calc.sh
或
$ source ./calc.sh$ type .. is a shell builtin$ type sourcesource is a shell builtin
办法三:是修改文件为可执行,直接在当前 Shell 下执行
$ chmod ./calc.sh$ ./calc.sh
下面,逐一演示用其他方法计算变量加一,即把
((i++))行替换成下面的某一个:
let i++;i=$(expr $i + 1)i=$(echo $i+1|bc)i=$(echo $i 1 | awk '{printf $1+$2;}')
比较计算时间如下:
$ time calc.sh10000real 0m1.319suser 0m1.056ssys 0m0.036s$ time calc_let.sh10000real 0m1.426suser 0m1.176ssys 0m0.032s$ time calc_expr.sh1000real 0m27.425suser 0m5.060ssys 0m14.177s$ time calc_bc.sh1000real 0m56.576suser 0m9.353ssys 0m24.618s$ time ./calc_awk.sh100real 0m11.672suser 0m2.604ssys 0m2.660s
说明:
time命令可以用来统计命令执行时间,这部分时间包括总的运行时间,用户空间执行时间,内核空间执行时间,它通过
ptrace系统调用实现。
通过上述比较可以发现
(())的运算效率最高。而
let作为 Shell 内置命令,效率也很高,但是
expr,
bc,
awk的计算效率就比较低。所以,在 Shell 本身能够完成相关工作的情况下,建议优先使用 Shell 本身提供的功能。但是 Shell 本身无法完成的功能,比如浮点运算,所以就需要外部命令的帮助。另外,考虑到 Shell 脚本的可移植性,在性能不是很关键的情况下,不要使用某些 Shell 特有的语法。
let,
expr,
bc都可以用来求模,运算符都是
%,而
let和
bc可以用来求幂,运算符不一样,前者是
**,后者是
^。例如:
$ expr 5 % 21$ let i=5%2$ echo $i1$ echo 5 % 2 | bc1$ ((i=5%2))$ echo $i1
$ let i=5**2$ echo $i25$ ((i=5**2))$ echo $i25$ echo 5^2 | bc25
进制转换也是比较常用的操作,可以用
Bash的内置支持也可以用
bc来完成,例如把 8 进制的 11 转换为 10 进制,则可以:
$ echo obase=10;ibase=8;11 | bc -l9$ echo $((8#11))9
上面都是把某个进制的数转换为 10 进制的,如果要进行任意进制之间的转换还是
bc比较灵活,因为它可以直接用
ibase和
obase分别指定进制源和进制转换目标。
如果要把某些字符串以特定的进制表示,可以用
od命令,例如默认的分隔符
IFS包括空格、
TAB以及换行,可以用
man ascii佐证。
$ echo -n $IFS | od -c0000000 t n0000003$ echo -n $IFS | od -b0000000 040 011 0120000003
let和
expr都无法进行浮点运算,但是
bc和
awk可以。
$ echo scale=3; 1/13 | bc.076$ echo 1 13 | awk '{printf(%0.3fn,$1/$2)}'0.077
说明:
bc在进行浮点运算时需指定精度,否则默认为 0,即进行浮点运算时,默认结果只保留整数。而
awk在控制小数位数时非常灵活,仅仅通过
printf的格式控制就可以实现。
补充:在用
bc进行运算时,如果不用
scale指定精度,而在
bc后加上
-l选项,也可以进行浮点运算,只不过这时的默认精度是 20 位。例如:
$ echo 1/13100 | bc -l.00007633587786259541
用
bc -l计算,可以获得高精度:
$ export cos=0.996293; echo scale=100; a(sqrt(1-$cos^2)/$cos)*180/(a(1)*4) | bc -l4.9349547554113836327198340369318406051597063986552438753727649177325495504159766011527078286004072131
当然也可以用
awk来计算:
$ echo 0.996293 | awk '{ printf(%sn, atan2(sqrt(1-$1^2),$1)*180/3.1415926535);}'4.93495
在这里随机产生了一组测试数据,文件名为
income.txt。
1 3 44902 5 38963 4 31124 4 47165 4 45786 6 53997 3 50898 6 30299 4 619510 5 5145
说明:上面的三列数据分别是家庭编号、家庭人数、家庭月总收入。
分析:为了求月均收入最高家庭,需要对后面两列数进行除法运算,即求出每个家庭的月均收入,然后按照月均收入排序,找出收入最高家庭。
实现:
#!/bin/bash# gettopfamily.sh[ $# -lt 1 ] && echo please input the income file && exit -1[ ! -f $1 ] && echo $1 is not a file && exit -1income=$1awk '{ printf(%d %0.2fn, $1, $3/$2);}' $income | sort -k 2 -n -r
说明:
[ $# -lt 1 ]:要求至少输入一个参数,
$#是 Shell 中传入参数的个数
[ ! -f $1 ]:要求输入参数是一个文件,
-f的用法见
test命令,
man test
income=$1:把输入参数赋给 income 变量,再作为
awk的参数,即需处理的文件
awk:用文件第三列除以第二列,求出月均收入,考虑到精确性,保留了两位精度
sort -k 2 -n -r:这里对结果的
awk结果的第二列
-k 2,即月均收入进行排序,按照数字排序
-n,并按照递减的顺序排序
-r。
演示:
$ ./gettopfamily.sh income.txt7 1696.339 1548.751 1496.674 1179.005 1144.5010 1029.006 899.832 779.203 778.008 504.83
补充:之前的
income.txt数据是随机产生的。在做一些实验时,往往需要随机产生一些数据,在下一小节,我们将详细介绍它。这里是产生
income.txt数据的脚本:
#!/bin/bash# genrandomdata.shfor i in $(seq 1 10)do echo $i $(($RANDOM/8192+3)) $((RANDOM/10+3000))done
说明:上述脚本中还用到
seq命令产生从1到10的一列数,这个命令的详细用法在该篇最后一节也会进一步介绍。
环境变量
RANDOM产生从 0 到 32767 的随机数,而
awk的
rand()函数可以产生 0 到 1 之间的随机数。
$ echo $RANDOM81$ echo | awk '{srand(); printf(%f, rand());}'0.237788
说明:
srand()在无参数时,采用当前时间作为
rand()随机数产生器的一个
seed。
可以通过
RANDOM变量的缩放和
awk中
rand()的放大来实现。
$ expr $RANDOM / 128$ echo | awk '{srand(); printf(%dn, rand()*255);}'
思考:如果要随机产生某个 IP 段的 IP 地址,该如何做呢?看例子:友善地获取一个可用的 IP 地址。
#!/bin/bash# getip.sh -- get an usable ipaddress automatically# author: falcon <[email protected]># update: Tue Oct 30 23:46:17 CST 2007# set your own network, default gateway, and the time out of ping commandnet=192.168.1default_gateway=192.168.1.1over_time=2# check the current ipaddressping -c 1 $default_gateway -W $over_time[ $? -eq 0 ] && echo the current ipaddress is okey! && exit -1;while :; do # clear the current configuration ifconfig eth0 down # configure the ip address of the eth0 ifconfig eth0 $net.$(($RANDOM /130 +2)) up # configure the default gateway route add default gw $default_gateway # check the new configuration ping -c 1 $default_gateway -W $over_time # if work, finish [ $? -eq 0 ] && breakdone
说明:如果你的默认网关地址不是
192.168.1.1,请自行配置
default_gateway(可以用
route -n命令查看),因为用
ifconfig配置地址时不能配置为网关地址,否则你的IP地址将和网关一样,导致整个网络不能正常工作。
其实通过一个循环就可以产生一系列数,但是有相关工具为什么不用呢!
seq就是这么一个小工具,它可以产生一系列数,你可以指定数的递增间隔,也可以指定相邻两个数之间的分割符。
$ seq 512345$ seq 1 512345$ seq 1 2 5135$ seq -s: 1 2 51:3:5$ seq 1 2 14135791113$ seq -w 1 2 1401030507091113$ seq -s: -w 1 2 1401:03:05:07:09:11:13$ seq -f 0x%g 1 50x10x20x30x40x5
一个比较典型的使用
seq的例子,构造一些特定格式的链接,然后用
wget下载这些内容:
$ for i in `seq -fhttp://thns.tsinghua.edu.cn/thnsebooks/ebook73/%02g.pdf 1 21`;do wget -c $i; done
或者
$ for i in `seq -w 1 21`;do wget -c http://thns.tsinghua.edu.cn/thnsebooks/ebook73/$i; done
补充:在
Bash版本 3 以上,在
for循环的
in后面,可以直接通过
{1..5}更简洁地产生自 1 到 5 的数字(注意,1 和 5 之间只有两个点),例如:
$ for i in {1..5}; do echo -n $i ; done1 2 3 4 5
我们先给单词一个定义:由字母组成的单个或者多个字符系列。
首先,统计每个单词出现的次数:
$ wget -c http://tinylab.org$ cat index.html | sed -e s/[^a-zA-Z]/n/g | grep -v ^$ | sort | uniq -c
接着,统计出现频率最高的前10个单词:
$ wget -c http://tinylab.org$ cat index.html | sed -e s/[^a-zA-Z]/n/g | grep -v ^$ | sort | uniq -c | sort -n -k 1 -r | head -10 524 a 238 tag 205 href 201 class 193 http 189 org 175 tinylab 174 www 146 div 128 title
说明:
cat index.html: 输出 index.html 文件里的内容
sed -e s/[^a-zA-Z]/n/g: 把非字母字符替换成空格,只保留字母字符
grep -v ^$: 去掉空行
sort: 排序
uniq -c:统计相同行的个数,即每个单词的个数
sort -n -k 1 -r:按照第一列
-k 1的数字
-n逆序
-r排序
head -10:取出前十行
可以考虑采取两种办法:
只统计那些需要统计的单词
用上面的算法把所有单词的个数都统计出来,然后再返回那些需要统计的单词给用户
不过,这两种办法都可以通过下面的结构来实现。先看办法一:
#!/bin/bash# statistic_words.shif [ $# -lt 1 ]; then echo Usage: basename $0 FILE WORDS .... exit -1fiFILE=$1((WORDS_NUM=$#-1))for n in $(seq $WORDS_NUM)do shift cat $FILE | sed -e s/[^a-zA-Z]/n/g | grep -v ^$ | sort | grep ^$1$ | uniq -cdone
说明:
if 条件部分:要求至少两个参数,第一个单词文件,之后参数为要统计的单词
FILE=$1: 获取文件名,即脚本之后的第一个字符串
((WORDS_NUM=$#-1)):获取单词个数,即总的参数个数
$#减去文件名参数(1个)
for 循环部分:首先通过
seq产生需要统计的单词个数系列,
shift是 Shell 内置变量(请通过
help shift获取帮助),它把用户从命令行中传入的参数依次往后移动位置,并把当前参数作为第一个参数即
$1,这样通过
$1就可以遍历用户所有输入的单词(仔细一想,这里貌似有数组下标的味道)。你可以考虑把
shift之后的那句替换成
echo $1测试
shift的用法
演示:
$ chmod +x statistic_words.sh$ ./statistic_words.sh index.html tinylab linux python 175 tinylab 43 linux 3 python
再看办法二,我们只需要修改
shift之后的那句即可:
#!/bin/bash# statistic_words.shif [ $# -lt 1 ]; then echo ERROR: you should input 2 words at least; echo Usage: basename $0 FILE WORDS .... exit -1fiFILE=$1((WORDS_NUM=$#-1))for n in $(seq $WORDS_NUM)do shift cat $FILE | sed -e s/[^a-zA-Z]/n/g | grep -v ^$ | sort | uniq -c | grep $1$done
演示:
$ ./statistic_words.sh index.html tinylab linux python 175 tinylab 43 linux 3 python
说明:很明显,办法一的效率要高很多,因为它提前找出了需要统计的单词,然后再统计,而后者则不然。实际上,如果使用
grep的
-E选项,我们无须引入循环,而用一条命令就可以搞定:
$ cat index.html | sed -e s/[^a-zA-Z]/n/g | grep -v ^$ | sort | grep -E ^tinylab$|^linux$ | uniq -c 43 linux 175 tinylab
或者
$ cat index.html | sed -e s/[^a-zA-Z]/n/g | grep -v ^$ | sort | egrep ^tinylab$|^linux$ | uniq -c 43 linux 175 tinylab
说明:需要注意到
sed命令可以直接处理文件,而无需通过
cat命令输出以后再通过管道传递,这样可以减少一个不必要的管道操作,所以上述命令可以简化为:
$ sed -e s/[^a-zA-Z]/n/g index.html | grep -v ^$ | sort | egrep ^tinylab$|^linux$ | uniq -c 43 linux 175 tinylab
所以,可见这些命令
sed,
grep,
uniq,
sort是多么有用,它们本身虽然只完成简单的功能,但是通过一定的组合,就可以实现各种五花八门的事情啦。对了,统计单词还有个非常有用的命令
wc -w,需要用到的时候也可以用它。
补充:在 Advanced Bash-Scripting Guide一书中还提到
jot命令和
factor命令,由于机器上没有,所以没有测试,
factor命令可以产生某个数的所有素数。如:
$ factor 100100: 2 2 5 5
到这里,Shell 编程范例之数值计算就结束啦。该篇主要介绍了:
Shell 编程中的整数运算、浮点运算、随机数的产生、数列的产生
Shell 的内置命令、外部命令的区别,以及如何查看他们的类型和帮助
Shell 脚本的几种执行办法
几个常用的 Shell 外部命令:
sed,
awk,
grep,
uniq,
sort等
范例:数字递增;求月均收入;自动获取
IP地址;统计单词个数
其他:相关用法如命令列表,条件测试等在上述范例中都已涉及,请认真阅读之
如果您有时间,请温习之。
Advanced Bash-Scripting Guide
shell 十三问
shell 基础十二篇
SED 手册
AWK 使用手册
几个 Shell 讨论区
LinuxSir.org
ChinaUnix.net
大概花了 3 个多小时才写完,目前是 23:33,该回宿舍睡觉啦,明天起来修改错别字和补充一些内容,朋友们晚安!
10 月 31 号,修改部分措辞,增加一篇统计家庭月均收入的范例,添加总结和参考资料,并用附录所有代码。
Shell 编程是一件非常有趣的事情,如果您想一想:上面计算家庭月均收入的例子,然后和用
M$ Excel来做这个工作比较,你会发现前者是那么简单和省事,而且给您以运用自如的感觉。