关于shell脚本编程的最佳实践
代码风格规范开头有“蛇棒”所谓shebang其实就是在很多脚本的第一行出现的以”#!”开头的注释,他指明了当我们没有指定解释器的时候默认的解释器,一般可能是下面这样: #!/bin/bash 当然,解释器有很多种,除了bash之外,我们可以用下面的命令查看本机支持的解释器: $cat/etc/shells #/etc/shells:validloginshells /bin/sh /bin/dash /bin/bash /bin/rbash /usr/bin/screen 当我们直接使用 #!/usr/bin/envbash 这种方式是我们推荐的使用方式。 代码有注释注释,显然是一个常识,不过这里还是要再强调一下,这个在shell脚本里尤为重要。因为很多单行的shell命令不是那么浅显易懂,没有注释的话在维护起来会让人尤其的头大。
参数要规范这一点很重要,当我们的脚本需要接受参数的时候,我们一定要先判断参数是否合乎规范,并给出合适的回显,方便使用者了解参数的使用。 if[[$#!=2]];then echo"Parameterincorrect." exit1 fi 变量和魔数一般情况下我们会将一些重要的环境变量定义在开头,确保这些变量的存在。 source/etc/profile exportPATH=”/usr/local/bin:/usr/bin:/bin:/usr/local/sbin:/usr/sbin:/sbin:/apps/bin/” 这种定义方式有一个很常见的用途,最典型的应用就是,当我们本地安装了很多java版本时,我们可能需要指定一个java来用。那么这时我们就会在脚本开头重新定义 同时,一段好的代码通常是不会有很多硬编码在代码里的“魔数”的。如果一定要有,通常是用一个变量的形式定义在开头,然后调用的时候直接调用这个变量,这样方便日后的修改。 缩进有规矩对于shell脚本,缩进是个大问题。因为很多需要缩进的地方(比如if,for语句)都不长,所有很多人都懒得去缩进,而且很多人不习惯用函数,导致缩进功能被弱化。
命名有标准所谓命名规范,基本包含下面这几点:
编码要统一在写脚本的时候尽量使用UTF-8编码,能够支持中文等一些奇奇怪怪的字符。不过虽然能写中文,但是在写注释以及打log的时候还是尽量英文,毕竟很多机器还是没有直接支持中文的,打出来可能会有乱码。 权限记得加这一点虽然很小,但是我个人却经常忘记,不加执行权限会导致无法直接执行,有点讨厌。。。 日志和回显日志的重要性不必多说,能够方便我们回头纠错,在大型的项目里是非常重要的。 密码要移除不要把密码硬编码在脚本里,不要把密码硬编码在脚本里,不要把密码硬编码在脚本里。 太长要分行在调用某些程序的时候,参数可能会很长,这时候为了保证较好的阅读体验,我们可以用反斜杠来分行: ./configure ?Cprefix=/usr ?Csbin-path=/usr/sbin/nginx ?Cconf-path=/etc/nginx/nginx.conf 注意在反斜杠前有个空格。 编码细节规范代码有效率在使用命令的时候要了解命令的具体做法,尤其当数据处理量大的时候,要时刻考虑该命令是否会影响效率。 sed-n'1p'file sed-n'1p;1q'file 他们的作用一样,都是获取文件的第一行。但是第一条命令会读取整个文件,而第二条命令只读取第一行。当文件很大的时候,仅仅是这样一条命令不一样就会造成巨大的效率差异。 勤用双引号几乎所有的大佬都推荐在使用”$”来获取变量的时候最好加上双引号。 #!/bin/sh #已知当前文件夹有一个a.sh的文件 var="*.sh" echo$var echo"$var" 他的运行结果如下: a.sh *.sh 为啥会这样呢?其实可以解释为他执行了下面的命令: echo*.sh echo"*.sh" 在很多情况下,在将变量作为参数的时候,一定要注意上面这一点,仔细体会其中的差异。上面只是一个非常小的例子,实际应用的时候由于这个细节导致的问题实在是太多了。。。 巧用main函数我们知道,像java,C这样的编译型语言都会有一个函数入口,这种结构使得代码可读性很强,我们知道哪些直接执行,那些是函数。但是脚本不一样,脚本属于解释性语言,从第一行直接执行到最后一行,如果在这当中命令与函数糅杂在一起,那就非常难读了。 #!/usr/bin/envpython deffunc1(): pass deffunc2(): pass if__name__=='__main__': func1() func2() 他用一个很巧妙的方法实现了我们习惯的main函数,使得代码可读性更强。 #!/usr/bin/envbash func1(){ #dosth } func2(){ #dosth } main(){ func1func2 } main"$@" 我们可以采用这种写法,同样实现类似的main函数,使得脚本的结构化程度更好。 考虑作用域shell中默认的变量作用域都是全局的,比如下面的脚本: #!/usr/bin/envbash var=1 func(){ var=2 } func echo$var 他的输出结果就是2而不是1,这样显然不符合我们的编码习惯,很容易造成一些问题。 巧用heredocs所谓heredocs,也可以算是一种多行输入的方法,即在”<<”后定一个标识符,接着我们可以输入多行内容,直到再次遇到标识符为止。 cat>>/etc/rsyncd.conf<<EOF logfile=/usr/local/logs/rsyncd.log transferlogging=yes logformat=%t%a%m%f%b syslogfacility=local3 EOF 学会查路径很多情况下,我们会先获取当前脚本的路径,然后一这个路径为基准,去找其他的路径。通常我们是直接用 script_dir=$(cd$(dirname$0)&&pwd) script_dir=$(dirname$(readlink-f$0)) 应当先cd进当前脚本的目录然后再pwd,或者直接读取当前脚本的所在路径。 代码要简短这里的简短不单单是指代码长度,而是只用到的命令数。原则上我们应当做到,能一条命令解决的问题绝不用两条命令解决。这不仅牵涉到代码的可读性,而且也关乎代码的执行效率。 cat/etc/passwd|greproot greproot/etc/passwd cat命令最为人不齿的用法就是这样,用的没有任何意义,明明一条命令可以解决,他非得加根管道。。。 使用新写法这里的新写法不是指有多厉害,而是指我们可能更希望使用较新引入的一些语法,更多是偏向代码风格的,比如
事实上,这些新写法很多功能都比旧的写法要强大,用的时候就知道了。 其他小tip考虑到还有很多零碎的点,就不一一展开了,这里简单提一提。
静态检查工具shellcheck概述为了从制度上保证脚本的质量,我们最简单的想法大概就是搞一个静态检查工具,通过引入工具来弥补开发者可能存在的知识盲点。 安装这个工具的对不同平台的支持力度都很大,他至少支持了Debian,Arch,Gentoo,EPEL,Fedora,OS X,openSUSE等等各种的平台的主流包管理工具。安装方便。具体可以参照安装文档 集成既然是静态检查工具,就一定可以集成在CI框架里,shellcheck可以非常方便的集成在Travis CI中,供以shell脚本为主语言的项目进行静态检查。 样例在文档的Gallery of bad code里,也提供了非常详细的“坏代码”的标准,具有非常不错的参考价值,可以在闲下来的时候当成”Java Puzzlers“之类的书来读读还是很惬意的。 本质不过,其实我觉得这个项目最最精华的部分都不是上面的功能,而是他提供了一个非常非常强大的wiki。在这个wiki里,我们可以找到这个工具所有判断的依据。在这里,每一个检测到的问题都可以在wiki里找到对应的问题单号,他不仅告诉我们”这样写不好”,而且告诉我们”为什么这样写不好”,”我们应当怎么写才好”,非常适合刨根问底党进一步研究。 转载自:https://blog.mythsman.com/2017/07/23/1/ (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |