grep 是 linux 下功能强大的文本过滤工具,支持基础字符串匹配、扩展正则表达式(-E)、上下文显示(-A/-B)、递归搜索(-r)、字段提取(-o)及多命令协作,熟练掌握可高效处理日志、配置等文本分析任务。

grep 是 Linux 下最常用也最强大的文本过滤工具,掌握它等于握住了处理日志、配置、代码和数据的钥匙。 它不只“找字符串”,而是通过模式匹配精准定位内容,配合正则表达式、上下文控制和多文件协作,能完成从简单搜索到复杂文本分析的绝大多数任务。
基础用法:从“找单词”开始
最常用的格式是 grep [选项] 模式 文件。模式可以是普通字符串,也可以是正则表达式。
- 查某行是否含 “Error”(不区分大小写):
grep -i "error" /var/log/syslog - 只显示匹配行的行号:
grep -n "warning" app.log - 反向匹配(显示不含某词的行):
grep -v "#$" config.conf(排除注释和空行) - 统计匹配行数:
grep -c "200 OK" access.log
正则进阶:让 grep 真正“懂语义”
默认 grep 使用基本正则(BRE),加 -E 可启用扩展正则(ERE),语法更直观;-P(gnu grep 支持)启用 perl 兼容正则,功能最强。
- 匹配 IP 地址片段(如 192.168.1.1):
grep -E '([0-9]{1,3}.){3}[0-9]{1,3}' log.txt - 匹配邮箱(简化版):
grep -E 'b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+.[A-Za-z]{2,}b' contacts.txt - 匹配以 # 开头、后跟至少一个非空格字符的注释行:
grep '^#[^[:space:]]' script.sh
上下文与结构化输出:不只是“找到就完事”
真实运维或开发中,单看一行往往不够——需要前因后果,或结构化提取字段。
- 显示匹配行及前后各 2 行:
grep -A 2 -B 2 "OutOfMemory" catalina.out - 只提取匹配部分(配合 -o):
grep -oE 'b[0-9]{4}-[0-9]{2}-[0-9]{2}b' diary.md(抽日期) - 结合 cut/sed/awk 进一步处理:
grep "GET /api/" access.log | awk '{print $1}' | sort | uniq -c | sort -nr(统计访问 IP 频次) - 递归搜索目录下所有 .conf 文件:
grep -r --include="*.conf" "listen 443" /etc/nginx/
实用技巧与避坑指南
很多问题不是不会用,而是没注意细节。
- 模式含特殊字符(如 *、$、[)时,记得用单引号包裹,避免 shell 提前解析:
grep '$HOME' env.sh - 想查纯单词(避免匹配到 substring),用
-w:grep -w "cat" file.txt不会匹配 “scat” 或 “category” - 二进制文件默认被跳过,强制搜索加
-a;不想搜二进制文件加--binary-files=without-match - 忽略大小写 + 全字匹配 + 显示行号,可组合:
grep -inw "debug" *.py
基本上就这些。grep 看似简单,但把 -E、-o、-A/B、-r 和正则串起来,就能替代不少专用工具。不复杂,但容易忽略细节——多练几次,自然成直觉。