Linux系統(tǒng)grep正則表達式怎么用
Linux系統(tǒng)正則表達式是字符串的標示方法, 主要的正則表達式有sed、vim、awk,當然還包括grep正則表達式。今天學習啦小編為大家講解下Linux系統(tǒng)grep正則表達式。
Linux系統(tǒng)grep正則表達式
一、grep命令的使用
首先,我們來了解grep命令,grep (global search regular expression and printing),全面搜索正則表達式并把行打印出來)是一種強大的文本搜索工具,它能使用正則表達式搜索文本,并把匹配的行打印出來。Linux中的grep命令包括、grep, egrep和fgrep 。egrep是grep的擴展,支持更多的re元字符,fgrep就是fast grep,搜索字符比較快,但不支持正則表達式。
然后,我們再來熟悉一下grep命令,其命令格式為:grep [options] ‘pattern’ FILE 。其中grep的常見選項:
-v:反向選取,只顯示不符合模式的行;
-o:只顯示被模式匹配的字串,而不是整個行;
-i:不區(qū)分字符的大小寫;
-r:遞歸搜索;
-A #:顯示匹配到行時,順帶顯示其后面的#個行;
-B #:顯示匹配到行時,順帶顯示其前面的#個行;
-C #:顯示匹配到行時,順帶顯示其前后的#個行;
另外 ,為了用戶查看顯示匹配的結果,可以在grep命令之后輸入 “--color=auto”,使結果呈現(xiàn)顏色。
二、 正則表達式
上面我們提到使用grep命令搜索正則表達式,那么我們來學習一下什么是正則表達式。
對于正則表達式,其起源并非在linux 中,正則表達式的“鼻祖”或許可一直追溯到科學家對人類神經(jīng)系統(tǒng)工作原理的早期研究。而其含義是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規(guī)則字符串”,這個“規(guī)則字符串”用來表達對字符串的一種過濾邏輯。給定一個正則表達式和另一個字符串,我們可以達到如下的目的:
1. 給定的字符串是否符合正則表達式的過濾邏輯(稱作“匹配”);
2. 可以通過正則表達式,從字符串中獲取我們想要的特定部分。
正則表達式由一些普通字符和一些元字符(metacharacters)組成。元字符不表示字符本身的意義,而用于額外功能性的描述。正則表達式的類型包括基本正則表達式和擴展正則表達式。
三、基本正則表達式
^:錨定行首的符合條件內(nèi)容,用法格式 "^pattern";
$: 錨定行尾的符合條件內(nèi)容,用法格式 "pattern$";
*:匹配緊挨著其前面的字符任意次 ;
.:匹配任意單個字符;
.*:匹配任意長度的任意字符(貪婪模式,盡可能的匹配);
r.*h (非錨定), ^r.*h$(錨定)
[] :匹配指定范圍內(nèi)的任意單個字符;
[^]:匹配指定范圍外的任意單個字符 ;
[[:space:]]:空白字符;
\?:匹配緊挨著在其前面的字符0次或1次;
\{m,n\}:匹配其前面的字符至少m次, 至多n次;
\{m,\}:至少m次,\{0,n\}:至多n次,0-n次;
\{m\}:精確匹配到m次;
\<:錨定詞首,用法格式:\<pattern;
\>: 錨定詞尾,用法格式:\>pattern;
\<pattern>:錨定單詞;
\(\):分組,用法格式:\(pattern\);
ab任意字符ab:ab.*ab;
a.b任意字符a.b;\(a.b\).* class="main">
Linux系統(tǒng)grep正則表達式怎么用
四、擴展正則表達式
.: 任意單個字符
[ ] : 匹配指定范圍內(nèi)的任意單個字符;
[^]:匹配指定范圍外的任意單個字符 ;
*:匹配緊挨著其前面的字符任意次
+:匹配其前面的字符至少1次
{m,n}:至少m次,至多n次
():分組,支持引用 class="main">
Linux系統(tǒng)grep正則表達式怎么用
Linux系統(tǒng)grep正則表達式
一、grep命令的使用
首先,我們來了解grep命令,grep (global search regular expression and printing),全面搜索正則表達式并把行打印出來)是一種強大的文本搜索工具,它能使用正則表達式搜索文本,并把匹配的行打印出來。Linux中的grep命令包括、grep, egrep和fgrep 。egrep是grep的擴展,支持更多的re元字符,fgrep就是fast grep,搜索字符比較快,但不支持正則表達式。
然后,我們再來熟悉一下grep命令,其命令格式為:grep [options] ‘pattern’ FILE 。其中grep的常見選項:
-v:反向選取,只顯示不符合模式的行;
-o:只顯示被模式匹配的字串,而不是整個行;
-i:不區(qū)分字符的大小寫;
-r:遞歸搜索;
-A #:顯示匹配到行時,順帶顯示其后面的#個行;
-B #:顯示匹配到行時,順帶顯示其前面的#個行;
-C #:顯示匹配到行時,順帶顯示其前后的#個行;
另外 ,為了用戶查看顯示匹配的結果,可以在grep命令之后輸入 “--color=auto”,使結果呈現(xiàn)顏色。
二、 正則表達式
上面我們提到使用grep命令搜索正則表達式,那么我們來學習一下什么是正則表達式。
對于正則表達式,其起源并非在linux 中,正則表達式的“鼻祖”或許可一直追溯到科學家對人類神經(jīng)系統(tǒng)工作原理的早期研究。而其含義是對字符串操作的一種邏輯公式,就是用事先定義好的一些特定字符、及這些特定字符的組合,組成一個“規(guī)則字符串”,這個“規(guī)則字符串”用來表達對字符串的一種過濾邏輯。給定一個正則表達式和另一個字符串,我們可以達到如下的目的:
1. 給定的字符串是否符合正則表達式的過濾邏輯(稱作“匹配”);
2. 可以通過正則表達式,從字符串中獲取我們想要的特定部分。
正則表達式由一些普通字符和一些元字符(metacharacters)組成。元字符不表示字符本身的意義,而用于額外功能性的描述。正則表達式的類型包括基本正則表達式和擴展正則表達式。
三、基本正則表達式
^:錨定行首的符合條件內(nèi)容,用法格式 "^pattern";
$: 錨定行尾的符合條件內(nèi)容,用法格式 "pattern$";
*:匹配緊挨著其前面的字符任意次 ;
.:匹配任意單個字符;
.*:匹配任意長度的任意字符(貪婪模式,盡可能的匹配);
r.*h (非錨定), ^r.*h$(錨定)
[] :匹配指定范圍內(nèi)的任意單個字符;
[^]:匹配指定范圍外的任意單個字符 ;
[[:space:]]:空白字符;
\?:匹配緊挨著在其前面的字符0次或1次;
\{m,n\}:匹配其前面的字符至少m次, 至多n次;
\{m,\}:至少m次,\{0,n\}:至多n次,0-n次;
\{m\}:精確匹配到m次;
\<:錨定詞首,用法格式:\<pattern;
\>: 錨定詞尾,用法格式:\>pattern;
\<pattern>:錨定單詞;
\(\):分組,用法格式:\(pattern\);
ab任意字符ab:ab.*ab;
a.b任意字符a.b;\(a.b\).*\1 (1的含義是以相同的內(nèi)容出現(xiàn))。
四、擴展正則表達式
.: 任意單個字符
[ ] : 匹配指定范圍內(nèi)的任意單個字符;
[^]:匹配指定范圍外的任意單個字符 ;
*:匹配緊挨著其前面的字符任意次
+:匹配其前面的字符至少1次
{m,n}:至少m次,至多n次
():分組,支持引用\1,\2
a|b:二選一
\<: 錨定詞首,用法格式:\<pattern;
\>: 錨定詞尾,用法格式:\>pattern;
^ : 錨定行首的符合條件內(nèi)容
$ : 錨定行尾的符合條件內(nèi)容
正則表達式是如何運用在linux的命令中的呢下面我們一起來看看幾簡單的實例分析正則表達式。
五、 正則表達式與grep命令的實戰(zhàn)演 練
1,顯示/etc/rc.d/rc.sysinit文件中以不區(qū)分大小的h開頭的行;
# grep “^[hH]” /etc/rc.d/rc.sysinit
2, 顯示/etc/passwd中以sh結尾的行;
# grep “sh$” /etc/passwd
3, 顯示/etc/fstab中以#開頭,且后面跟兩個或多個空白字符,而后又跟了任意非空白字符的行;
#grep “^#[[:space:]]\{1,\}[^[:space:]] /etc/fstab
4, 顯示/etc/rc.d/rc.local中符合形為“任意單個字符n任意字符任意單個字符n”模式的行;
# grep “\(.i\).*\1” /etc/rc.d/rc.local
5, 查找/etc/inittab中含有“以s開頭,并以d結尾的單詞”模式的行;
# grep “\<s[a-zA-Z]*d\>” /etc/inittab
或#grep “\<s[^[:space:]]*d\>” /etc/inittab
6, 查找ifconfig命令結果中的1-255之間的整數(shù);
# grep | -E "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>"
7,顯示/var/log/secure文件中包含“Failed”或“FAILED”的行;而后統(tǒng)計相關的行數(shù)
# egrep “(Failed | FAILED )” /var/log/secure | wc -l
8,在/etc/passwd中取出默認shell為bash,且其用戶ID號最小的用戶的用戶名
# grep "bash$" /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1
grep正則表達式元字符集:
^ 錨定行的開始 如:‘^grep’匹配所有以grep開頭的行。
$ 錨定行的結束 如:‘grep$’匹配所有以grep結尾的行。
.匹配一個非換行符的字符 如:‘gr.p’匹配gr后接一個任意字符,然后是p。
* 匹配零個或多個先前字符 如:‘*grep’匹配所有一個或多個空格后緊跟grep的行。 .*一起用代表任意字符。
[] 匹配一個指定范圍內(nèi)的字符,如‘[Gg]rep’匹配Grep和grep。
[^] 匹配一個不在指定范圍內(nèi)的字符,如:‘[^A-FH-Z]rep’匹配不包含A-R和T-Z的一個字母開頭,緊跟rep的行。
/(../) 標記匹配字符,如‘/(love/)’,love被標記為1。
/ 錨定單詞的開始,如:‘/匹配包含以grep開頭的單詞的行。
/》 錨定單詞的結束,如’grep/》‘匹配包含以grep結尾的單詞的行。
x/{m/} 重復字符x,m次,如:’0/{5/}‘匹配包含5個o的行。
x/{m,/} 重復字符x,至少m次,如:’o/{5,/}‘匹配至少有5個o的行。
x/{m,n/}重復字符x,至少m次,不多于n次,如:’o/{5,10/}‘匹配5--10個o的行。
/w 匹配文字和數(shù)字字符,也就是[A-Za-z0-9],如:’G/w*p‘匹配以G后跟零個或多個文字或數(shù)字字符,然后是p。
/b 單詞鎖定符,如: ’/bgrep/b‘只匹配grep。
常用的 grep 選項有:
-c 只輸出匹配行的個數(shù)。
-i 不區(qū)分大小寫(只適用于單字符)。
-h 查詢多文件時不顯示文件名。
-l 查詢多文件時只輸出包含匹配字符的文件名。
-n 顯示匹配行及行號。
-s 不顯示不存在或無匹配文本的錯誤信息。
-v 顯示不包含匹配文本的所有行。
-V 顯示軟件版本信息
使用grep匹配時最好用雙引號引起來,防止被系統(tǒng)誤認為參數(shù)或者特殊命令,也可以匹配多個單詞。
關于匹配的實例:
grep -c “48” test.txt 統(tǒng)計所有以“48”字符開頭的行有多少
grep -i “May” test.txt 不區(qū)分大小寫查找“May”所有的行)
grep -n “48” test.txt 顯示行號;顯示匹配字符“48”的行及行號,相同于 nl test.txt |grep 48)
grep -v “48” test.txt 顯示輸出沒有字符“48”所有的行)
grep “471” test.txt 顯示輸出字符“471”所在的行)
grep “48;” test.txt 顯示輸出以字符“48”開頭,并在字符“48”后是一個tab鍵所在的行
grep “48[34]” test.txt 顯示輸出以字符“48”開頭,第三個字符是“3”或是“4”的所有的行)
grep “^[^48]” test.txt 顯示輸出行首不是字符“48”的行)
grep “[Mm]ay” test.txt 設置大小寫查找:顯示輸出第一個字符以“M”或“m”開頭,以字符“ay”結束的行)
grep “K…D” test.txt 顯示輸出第一個字符是“K”,第二、三、四是任意字符,第五個字符是“D”所在的行)
grep “[A-Z][9]D” test.txt 顯示輸出第一個字符的范圍是“A-D”,第二個字符是“9”,第三個字符的是“D”的所有的行
grep “[35]..1998” test.txt 顯示第一個字符是3或5,第二三個字符是任意,以1998結尾的所有行
grep “4/{2,/}” test.txt 模式出現(xiàn)幾率查找:顯示輸出字符“4”至少重復出現(xiàn)兩次的所有行
grep “9/{3,/}” test.txt 模式出現(xiàn)幾率查找:顯示輸出字符“9”至少重復出現(xiàn)三次的所有行
grep “9/{2,3/}” test.txt 模式出現(xiàn)幾率查找:顯示輸出字符“9”重復出現(xiàn)的次數(shù)在一定范圍內(nèi),重復出現(xiàn)2次或3次所有行
grep -n “^$” test.txt 顯示輸出空行的行號
ls -l |grep “^d” 如果要查詢目錄列表中的目錄 同:ls -d *
ls -l |grep “^d[d]” 在一個目錄中查詢不包含目錄的所有文件
ls -l |grpe “^d…..x..x” 查詢其他用戶和用戶組成員有可執(zhí)行權限的目錄集合
以上就是Linux系統(tǒng)grep正則表達式的用法介紹了,如果是要建設網(wǎng)站或者服務器,那么對正則表達式的需求很大,所以很有必要去了解grep正則表達式。
a|b:二選一
\<: 錨定詞首,用法格式:\<pattern;
\>: 錨定詞尾,用法格式:\>pattern;
^ : 錨定行首的符合條件內(nèi)容
$ : 錨定行尾的符合條件內(nèi)容
正則表達式是如何運用在linux的命令中的呢下面我們一起來看看幾簡單的實例分析正則表達式。
五、 正則表達式與grep命令的實戰(zhàn)演 練
1,顯示/etc/rc.d/rc.sysinit文件中以不區(qū)分大小的h開頭的行;
# grep “^[hH]” /etc/rc.d/rc.sysinit
2, 顯示/etc/passwd中以sh結尾的行;
# grep “sh$” /etc/passwd
3, 顯示/etc/fstab中以#開頭,且后面跟兩個或多個空白字符,而后又跟了任意非空白字符的行;
#grep “^#[[:space:]]\{1,\}[^[:space:]] /etc/fstab
4, 顯示/etc/rc.d/rc.local中符合形為“任意單個字符n任意字符任意單個字符n”模式的行;
# grep “\(.i\).* class="main">
Linux系統(tǒng)grep正則表達式怎么用
5, 查找/etc/inittab中含有“以s開頭,并以d結尾的單詞”模式的行;
# grep “\<s[a-zA-Z]*d\>” /etc/inittab
或#grep “\<s[^[:space:]]*d\>” /etc/inittab
6, 查找ifconfig命令結果中的1-255之間的整數(shù);
# grep | -E "\<([1-9]|[1-9][0-9]|1[0-9][0-9]|2[0-4][0-9]|25[0-5])\>"
7,顯示/var/log/secure文件中包含“Failed”或“FAILED”的行;而后統(tǒng)計相關的行數(shù)
# egrep “(Failed | FAILED )” /var/log/secure | wc -l
8,在/etc/passwd中取出默認shell為bash,且其用戶ID號最小的用戶的用戶名
# grep "bash$" /etc/passwd | sort -n -t: -k3 | head -1 | cut -d: -f1
grep正則表達式元字符集:
^ 錨定行的開始 如:‘^grep’匹配所有以grep開頭的行。
$ 錨定行的結束 如:‘grep$’匹配所有以grep結尾的行。
.匹配一個非換行符的字符 如:‘gr.p’匹配gr后接一個任意字符,然后是p。
* 匹配零個或多個先前字符 如:‘*grep’匹配所有一個或多個空格后緊跟grep的行。 .*一起用代表任意字符。
[] 匹配一個指定范圍內(nèi)的字符,如‘[Gg]rep’匹配Grep和grep。
[^] 匹配一個不在指定范圍內(nèi)的字符,如:‘[^A-FH-Z]rep’匹配不包含A-R和T-Z的一個字母開頭,緊跟rep的行。
/(../) 標記匹配字符,如‘/(love/)’,love被標記為1。
/ 錨定單詞的開始,如:‘/匹配包含以grep開頭的單詞的行。
/》 錨定單詞的結束,如’grep/》‘匹配包含以grep結尾的單詞的行。
x/{m/} 重復字符x,m次,如:’0/{5/}‘匹配包含5個o的行。
x/{m,/} 重復字符x,至少m次,如:’o/{5,/}‘匹配至少有5個o的行。
x/{m,n/}重復字符x,至少m次,不多于n次,如:’o/{5,10/}‘匹配5--10個o的行。
/w 匹配文字和數(shù)字字符,也就是[A-Za-z0-9],如:’G/w*p‘匹配以G后跟零個或多個文字或數(shù)字字符,然后是p。
/b 單詞鎖定符,如: ’/bgrep/b‘只匹配grep。
常用的 grep 選項有:
-c 只輸出匹配行的個數(shù)。
-i 不區(qū)分大小寫(只適用于單字符)。
-h 查詢多文件時不顯示文件名。
-l 查詢多文件時只輸出包含匹配字符的文件名。
-n 顯示匹配行及行號。
-s 不顯示不存在或無匹配文本的錯誤信息。
-v 顯示不包含匹配文本的所有行。
-V 顯示軟件版本信息
使用grep匹配時最好用雙引號引起來,防止被系統(tǒng)誤認為參數(shù)或者特殊命令,也可以匹配多個單詞。
關于匹配的實例:
grep -c “48” test.txt 統(tǒng)計所有以“48”字符開頭的行有多少
grep -i “May” test.txt 不區(qū)分大小寫查找“May”所有的行)
grep -n “48” test.txt 顯示行號;顯示匹配字符“48”的行及行號,相同于 nl test.txt |grep 48)
grep -v “48” test.txt 顯示輸出沒有字符“48”所有的行)
grep “471” test.txt 顯示輸出字符“471”所在的行)
grep “48;” test.txt 顯示輸出以字符“48”開頭,并在字符“48”后是一個tab鍵所在的行
grep “48[34]” test.txt 顯示輸出以字符“48”開頭,第三個字符是“3”或是“4”的所有的行)
grep “^[^48]” test.txt 顯示輸出行首不是字符“48”的行)
grep “[Mm]ay” test.txt 設置大小寫查找:顯示輸出第一個字符以“M”或“m”開頭,以字符“ay”結束的行)
grep “K…D” test.txt 顯示輸出第一個字符是“K”,第二、三、四是任意字符,第五個字符是“D”所在的行)
grep “[A-Z][9]D” test.txt 顯示輸出第一個字符的范圍是“A-D”,第二個字符是“9”,第三個字符的是“D”的所有的行
grep “[35]..1998” test.txt 顯示第一個字符是3或5,第二三個字符是任意,以1998結尾的所有行
grep “4/{2,/}” test.txt 模式出現(xiàn)幾率查找:顯示輸出字符“4”至少重復出現(xiàn)兩次的所有行
grep “9/{3,/}” test.txt 模式出現(xiàn)幾率查找:顯示輸出字符“9”至少重復出現(xiàn)三次的所有行
grep “9/{2,3/}” test.txt 模式出現(xiàn)幾率查找:顯示輸出字符“9”重復出現(xiàn)的次數(shù)在一定范圍內(nèi),重復出現(xiàn)2次或3次所有行
grep -n “^$” test.txt 顯示輸出空行的行號
ls -l |grep “^d” 如果要查詢目錄列表中的目錄 同:ls -d *
ls -l |grep “^d[d]” 在一個目錄中查詢不包含目錄的所有文件
ls -l |grpe “^d…..x..x” 查詢其他用戶和用戶組成員有可執(zhí)行權限的目錄集合
以上就是Linux系統(tǒng)grep正則表達式的用法介紹了,如果是要建設網(wǎng)站或者服務器,那么對正則表達式的需求很大,所以很有必要去了解grep正則表達式。