Shell脚本中正则表达式

行走的泡泡 / 2023-08-11 / 原文

1.正则表达式过滤文本

REGEXP： Regular Expressions，由一类特殊字符及文本字符所编写的模式，其中有些字符（元字符）不表示字符字面意义，而表示控制或通配的功能，类似于增强版的通配符功能，但与通配符不同，通配符功能是用来处理文件名，而正则表达式是处理文本内容中字符。

正则表达式被很多程序和开发语言所广泛支持：vim， less，grep，sed,awk， nginx，mysql 等。

主要用来匹配字符串（命令结果，文本内容），

通配符匹配文件（而且是已存在的文件）

基本正则表达式
扩展正则表达式

可以使用 man 7 regex 查看帮助

1.1元字符

. 匹配任意单个字符，可以是一个汉字
[ ] 匹配指定范围内的任意单个字符，示例：[zhou] [0-9] [] [a-zA-Z] [:alpha:]
[ ^ ] 匹配指定范围外的任意单个字符,示例：[^zhou] [^a.z] [a.z]

[:alnum:] 字母和数字

1.2表示次数

* #匹配前面的字符任意次，包括0次，贪婪模式：尽可能长的匹配
.* #任意长度的任意字符,不包括0次
\? #匹配其前面的字符出现0次或1次,即:可有可无
\+ #匹配其前面的字符出现最少1次,即:肯定有且 >=1 次
\{n\} #匹配前面的字符n次
\{m,n\} #匹配前面的字符至少m次，至多n次
\{,n\} #匹配前面的字符至多n次,<=n
\{n,\} #匹配前面的字符至少n次

1.3表示位置锚定

^ #行首锚定, 用于模式的最左侧
$ #行尾锚定，用于模式的最右侧
^PATTERN$ #用于模式匹配整行（单独一行只有root）
^$ #空行
^[[:space:]]*$ # 空白行

\< 或 \b #词首锚定，用于单词模式的左侧(连续的数字，字母，下划线都算单词内部)
\> 或 \b #词尾锚定，用于单词模式的右侧
\<PATTERN\> #匹配整个单词