加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

一些小脚本与正则表达式

发布时间:2020-12-14 06:44:35 所属栏目:百科 来源:网络整理
导读:转载自:http://www.jb51.net/article/53967.htm 0. shell 调试 复制代码 代码如下: sh -x somefile.sh 在somefile.sh 文件里加上set+x set-x 1. 用 || 简化if else 复制代码 代码如下: gzip -t a.tar.gz if [[ 0 == $? ]]; then echo "good zip" else echo

转载自:http://www.aspzz.cn/article/53967.htm


0. shell 调试


复制代码代码如下:

sh -x somefile.sh


在somefile.sh 文件里加上set+x set-x
1. 用 && || 简化if else

复制代码代码如下:

gzip -t a.tar.gz
if [[ 0 == $? ]]; then
echo "good zip"
else
echo "bad zip"
fi


可以简化为:


复制代码代码如下:

gzip -t a.tar.gz && echo "good zip" || echo "bad zip"

2. 判断文件非空


复制代码代码如下:

if [[ -s $file ]]; then
echo "not empty"
fi

3. 获取文件大小


复制代码代码如下:

stat -c %s $file
stat --printf='%sn' $file
wc -c $file

4. 字符串替换


复制代码代码如下:

${string//pattern/replacement}
a='a,b,c'
echo ${a//,/ /}
5. Contains 子字符串?
string="My string"
if [[ $string == *My* ]]; then
echo "It's there!"
fi

6. rsync备份


复制代码代码如下:

rsync -r -t -v /source_folder /destination_folder
rsync -r -t -v /source_folder [user@host:/destination_folder

7. 批量重命名文件

为所有txt文件加上.bak 后缀:

复制代码代码如下:

rename '.txt' '.txt.bak' *.txt


去掉所有的bak后缀:

复制代码代码如下:

rename '*.bak' '' *.bak


把所有的空格改成下划线:

复制代码代码如下:

find path -type f -exec rename 's/ /_/g' {} ;


把文件名都改成大写:

复制代码代码如下:

find path -type f -exec rename 'y/a-z/A-Z/' {} ;

8. for/while 循环


复制代码代码如下:


for ((i=0; i < 10; i++)); do echo $i; done
for line in $(cat a.txt); do echo $line; done
for f in *.txt; do echo $f; done
while read line ; do echo $line; done < a.txt
cat a.txt | while read line; do echo $line; done


9. 删除空行

复制代码代码如下:


cat a.txt | sed -e '/^$/d'
(echo "abc"; echo ""; echo "ddd";) | awk '{if (0 != NF) print $0;}'


10. 比较文件的修改时间

复制代码代码如下:


[[ file1.txt -nt file2.txt ]] && echo true || echo false
[[ file1.txt -ot file2.txt ]] && echo true || echo false


11. 实现Dictionary结构

复制代码代码如下:

hput() {
eval "hkey_$1"="$2"
}
hget() {
eval echo '${'"hkey_$1"'}'
}
$ hput k1 aaa
$ hget k1
aaa

12. 去掉第二列


复制代码代码如下:


$echo 'a b c d e f' | cut -d ' ' -f1,3-
$a c d e f


13. 把stderr输出保存到变量

复制代码代码如下:


$ a=$( (echo 'out'; echo 'error' 1>&2) 2>&1 1>/dev/null)
$ echo $a
error

14. 删除前3行


复制代码代码如下:


$cat a.txt | sed 1,3d


15. 读取多个域到变量

复制代码代码如下:


read a b c <<< "xxx yyy zzz"


16. 遍历数组

复制代码代码如下:

array=( one two three )
for i in ${array[@]}
do
echo $i
done

17. 查看目录大小


复制代码代码如下:

$ du ?Csh ~/apps

18. 查看CPU信息


复制代码代码如下:

$ cat /proc/cpuinfo

19. date


复制代码代码如下:

$ date +%Y-%m-%d
2012-12-24
$ date +%Y-%m-%d ?Cdate ‘-1 day'
2012-12-23
$ date +%Y-m-%d ?Cdate ‘Dec 25'
2011-12-25
$ date +%Y-m-%d ?Cdate ‘Dec 25 ?C 10 days'
2011-12-15

20. 获取路径名和文件名


复制代码代码如下:


$ dirname ‘/home/lalor/a.txt'
/home/lalor
$ basename ‘/home/lalor/a.txt'
a.txt

21. 并集和交集

comm 可以用来求并集,交集,差集,假设现在有两个文件a和b,它们的内容如下:

复制代码代码如下:

$cat a
1
3
5


$cat b
3
4
5
6
7

$comm a b
1
3
4
5
6
7

$comm -1 -2 a b #交集
3
5

$comm a b | sed 's/t//g' #并集
1
2
3
4
5
6
7

$comm -1 -3 a b | sed 's/t//g' #b-a
4
6
7

22. awk复杂分隔符

多字符作分隔符

复制代码代码如下:

$ echo "a||b||c||d" | awk -F '[|][|]' '{print $3}'
c

多种分隔符1

复制代码代码如下:


$echo "a||b,#c d" | awk -F '[|,#]+' '{print $4}'
d


多种分隔符2

复制代码代码如下:

$echo "a||b##c|#d" | awk -F '([|][|])|([#][#])' '{print $NF}'
c|#d

23. 产生一个随机数

复制代码代码如下:


echo $RANDOM


24. 按照模式split 文件

复制代码代码如下:

csplit server.log /PATTERN/ -n 2 -s {*} -f server_result -b "%02d.log" -z

/PATTERN/ 用来匹配某一行,分割过程由此开始
{*} 根据匹配,重复执行分割
-s 静默模式
-n 分割后文件名后缀中,数字的个数
-f 分割后的文件名前缀
-b 指定后缀格式

25. 获取文件名或者扩展名


复制代码代码如下:

var=hack.fun.book.txt
echo ${var%.*}
hack.fun.book
echo ${var%%.*}
hack
echo ${var#.*}
fun.book.txt
echo ${var##.*}
txt

26. 以 root 帐户执行上一条命令。

复制代码代码如下:


$sudo !!


其中: * !! 是指上一条命令 * !$ 上一条命令的最后一个参数 * !* 上一条命令的所有参数 * !:3 上一条命令的第3个参数
例如:

复制代码代码如下:


$ls /tmp/somedir
ls: cannot access /tmp/somedir: No such file or directory
$mkdir !$
madir /tmp/somedir

27. 利用 python 搭建一个简单的 Web 服务器,可通过 http://$HOSTNAME:8000 访问。

复制代码代码如下:


python -m SimpleHTTPServer


28. 在 Vim 中无需权限保存编辑的文件。

复制代码代码如下:

:w !sudo tee %


29. 将上一条命令中的 foo 替换为 bar,并执行。

复制代码代码如下:

^foo^bar


30. 快速备份或复制文件。

复制代码代码如下:

cp filename{,.bak}


31. 将 ssh keys 复制到 user@host 以启用无密码 SSH 登录。

复制代码代码如下:

$ssh-copy-id user@host


32. 把 linux 桌面录制为视频。

复制代码代码如下:

ffmpeg -f x11grab -s wxga -r 25 -i :0.0 -sameq /tmp/out.mpg


33. man 妙用

复制代码代码如下:

man ascii
man test


34. 在 vim 中编辑上一条命令

复制代码代码如下:

fc


35. 删除0 字节文件或垃圾文件

复制代码代码如下:

find . -type f -size 0 -delete
find . -type f -exec rm -rf {} ;
find . -type f -name "a.out" -exec rm -rf {} ;
find . type f -name "a.out" -delete
find . type f -name "*.txt" -print0 | xargs -0 rm -f

36. 在编写SHELL 时显示多行信息

复制代码代码如下:


cat << EOF
+--------------------------------------------------------------+
| === Welcome to Tunoff services === |
+--------------------------------------------------------------+
EOF


注意,在指定结束符时,它必须是该行的唯一内容,并且该行必须以这个字符开头。
37. 如何给mysql建软链接

复制代码代码如下:

cd /usr/local/mysql/bin
for i in *
do ln /usr/local/mysql/bin/$i /usr/bin/$i
done


38. 获取IP地址:

复制代码代码如下:

ifconfig eth0 |grep "inet addr:" |awk '{print $2}'|cut -c 6-


39. 打开文件数目

复制代码代码如下:

lsof


40. 清除僵尸进程

复制代码代码如下:

ps -eal | awk '{ if ($2 == "Z"){ print $4}}' | kill -9


41. 打印唯一行

复制代码代码如下:

awk '!a[$0]++' file


42. 打印奇数行

复制代码代码如下:

awk 'i=!i' file
awk 'NR%2' file


43. 打印匹配行后的某一行

复制代码代码如下:

seq 10 | awk '/4/{f=4};--f==0{print;exit}'


44. 打印某行后后面的10行

复制代码代码如下:

cat file | grep -A100 string
cat file | grep -B100 string #前面
cat file | grep -C100 string #前后


sed -n '/string/,+100p'

awk '/string/{f=100}--f>=0'


45. 获取命令行最后一个参数

复制代码代码如下:

echo ${!#}
echo ${$#} #错误的尝试

46. 输出重定向

如果你愿你,可以将STDERR 和 STDOUT 的输出重定向到一个输出文件,为此,bash 提供了特殊的重定向符号 &>

复制代码代码如下:

ls file nofile &> /dev/null


我们如何在脚本里面重定向呢?没有什么特别之处,和普通重定向一样。

复制代码代码如下:

#!/bin/bash
#redirecting output to different locations
echo "now redirecting all output to another location" &>/dev/null


问题就来了,如果我们要将所有的输出都重定向到某个文件呢?我们都不希望每次输出的时候都重定向一下吧,正所谓,山人自有妙计。我们可以用exec 来永久重定向,如下所示:

复制代码代码如下:

#!/bin/bash
#redirecting output to different locations
exec 2>testerror
echo "This is the start of the script"
echo "now redirecting all output to another location"


exec 1>testout
echo "This output should go to testout file"
echo "but this should go the the testerror file" >& 2


输出结果如下所示:

复制代码代码如下:

This is the start of the script
now redirecting all output to another location
lalor@lalor:~/temp$ cat testout
This output should go to testout file
lalor@lalor:~/temp$ cat testerror
but this should go the the testerror file
lalor@lalor:~/temp$


以追加的方式重定向:

复制代码代码如下:

exec 3 >> testout


取消重定向:

复制代码代码如下:

exec 3> -

47. 函数

任何地方定义的变量都是全局变量,如果要定义局部变量,需加local 关键字
shell中的函数也可以用递归

复制代码代码如下:

#!/bin/bash


function factorial {
if [[ $1 -eq 1 ]]; then
echo 1
else
local temp=$[ $1 - 1 ]
local result=`factorial $temp`
echo $[ $result * $1 ]
fi
}

result=`factorial 5`
echo $result

创建函数库

将函数定一个在另一个文件,然后通过source 命令加载到当前文件

在命令行使用函数

将函数定义在~/.bashrc 中即可

向函数传递数组

复制代码代码如下:


#!/bin/bash
#adding values in an array


function addarray {
local sum=0
local newarray
newarray=(`echo "$@"`)
for value in ${newarray[*]}
do
sum=$[ $sum+$value ]
done
echo $sum
}

myarray=(1 2 3 4 5)
echo "The original array is: ${myarray[*]}"
arg1=`echo ${myarray[*]}`
result=`addarray $arg1`
echo "The result is $result"

48.正则表达式

匹配中文字符的正则表达式:[u4e00-u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^x00-xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:^ *$评注:可以用来删除空白行匹配HTML标记的正则表达式:<(S*?)[^>]*>.*?</1>|<.*? />评注:网上流传的版本太糟糕,上面这个也仅仅能匹配部分,对于复杂的嵌套标记依旧无能为力匹配首尾空白字符的正则表达式:^s*|s*$评注:可以用来删除行首行尾的空白字符(包括空格、制表符、换页符等等),非常有用的表达式匹配Email地址的正则表达式:w+([-+.]w+)*@w+([-.]w+)*.w+([-.]w+)*评注:表单验证时很实用匹配网址URL的正则表达式:[a-zA-z]+://[^s]*评注:网上流传的版本功能很有限,上面这个基本可以满足需求匹配帐号是否合法(字母开头,允许5-16字节,允许字母数字下划线):^[a-zA-Z][a-zA-Z0-9_]{4,15}$评注:表单验证时很实用匹配国内电话号码:d{3}-d{8}|d{4}-d{7}评注:匹配形式如0511-4405222或021-87888822匹配腾讯QQ号:[1-9][0-9]{4,}评注:腾讯QQ号从10000开始匹配中国邮政编码:[1-9]d{5}(?!d)评注:中国邮政编码为6位数字匹配身份证:d{15}|d{18}评注:中国的身份证为15位或18位匹配ip地址:d+.d+.d+.d+评注:提取ip地址时有用匹配特定数字:^[1-9]d*$  //匹配正整数^-[1-9]d*$ //匹配负整数^-?[1-9]d*$  //匹配整数^[1-9]d*|0$ //匹配非负整数(正整数+ 0)^-[1-9]d*|0$  //匹配非正整数(负整数+ 0)^[1-9]d*.d*|0.d*[1-9]d*$  //匹配正浮点数^-([1-9]d*.d*|0.d*[1-9]d*)$ //匹配负浮点数^-?([1-9]d*.d*|0.d*[1-9]d*|0?.0+|0)$ //匹配浮点数^[1-9]d*.d*|0.d*[1-9]d*|0?.0+|0$  //匹配非负浮点数(正浮点数+ 0)^(-([1-9]d*.d*|0.d*[1-9]d*))|0?.0+|0$  //匹配非正浮点数(负浮点数+ 0)评注:处理大量数据时有用,具体应用时注意修正匹配特定字符串:^[A-Za-z]+$  //匹配由26个英文字母组成的字符串^[A-Z]+$  //匹配由26个英文字母的大写组成的字符串^[a-z]+$  //匹配由26个英文字母的小写组成的字符串^[A-Za-z0-9]+$  //匹配由数字和26个英文字母组成的字符串^w+$  //匹配由数字、26个英文字母或者下划线组成的字符串

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读