Vbird的Linux私房菜学习笔记之正则表达式-特殊字符-白红宇

Vbird的Linux私房菜学习笔记之正则表达式-特殊字符

阅读量：6823 次

发布时间：2019-06-26

本文共 2258 字，大约阅读时间需要 7 分钟。

正则表达式：正则表达式是以行为单位处理字符串的一种方法。它可以藉由一些特殊符号的使用，可以让使用者轻易达到“查找/删除/替换”某特定字符串的功能。

由于使用的语系中英文字母，数字的编码顺序不同，所以会对正则表达式的处理结果产生影响，所以我们在使用正则表达式时，都是使用兼容POSIX的标准。为了避免英文字母、数字编码的不同对字符截取产生的影响，底下的特殊字符需要牢记！

[ ]搜索集合字符
示例：
grep -n 'goo[dg]' /tmp/test.txt
此命令会显示出test.txt文件中包含good或goog字符串的行并显示行号；
'[]'表示[]内字符合集中的某一个字符，[a-z]表示一个小写英文字符，[0-9]表示一个数字字符。

示例：

grep -n 'go\{2\}g' /tmp/test.txt

此命令会显示test.txt文件中出包含字符串goog的行，并且显示行号；

grep -n 'go\{2,5\}g' /tmp/test.txt

此命令会显示test.txt文件中出包含字符串goog,gooog,goooog或gooooog的行，并且显示行号；

遗留问题：如何找出包含2个重复英文字符形如"aa"、"bb"的行，并显示行号；

此处要用到扩展正则表达式，命令如下：

egrep -ni '([a-z])\1' /tmp/test.txt

此处的'\1'表示反向引用前面圆括号内匹配的内容

常规正则表达式元字符总结：

[]	字符合集中的任意一个字符，[abc]匹配a或b或c
[^]	排除字符合集中的所有字符，[^abc]匹配除了a或b或c之外的字符
^	行首符，^hello匹配以hello开头的行
$	行尾符，hello$匹配以hello结尾的行
.	匹配任意一个字符，g..d匹配g开头d结尾且中间有2个字符的字符串，如：good、glad、gadd
*	*匹配前导字符0到无穷次，goog匹配gog、goog、gooog....**
\{n,m\}	匹配前导字符n到m次； \{n\}:匹配前导字符n次； \{n,\}:匹配前导字符至少n次；

扩展正则表达式元字符：

+	匹配前导字符1次或1次以上，go+g匹配gog、goog、gooog.....
?	匹配前导字符0次或1次，go?g匹配gg、gog
\|	用or的方式找出数个匹配的字符串goog\|hello\|test匹配goog或hello或test
()	找出群组字符串，g(oo\|la)d匹配good或glad
()+	匹配()内容1次或1次以上，(very)+good匹配verygood、veryverygood....
()\1	反向引用()的内容，([a-c])\1匹配aa、bb、cc，即用()的内容代替\1

当然扩展正则表达式也需要工具程序的支持才能使用，比如grep就不支持扩展正则表达式，要用egrep指令才行。

转载于:https://blog.51cto.com/leohsiung/1205098

你可能感兴趣的文章