Linux文件比较方法_diff与cmp使用

3次阅读

diff用于文本文件行级差异比较,cmp用于任意文件逐字节比对;前者适合代码配置等场景,后者适用于二进制一致性验证。

Linux文件比较方法_diff与cmp使用

linux中比较文件内容,diffcmp是最常用的两个命令,但它们用途不同:diff适合查看文本文件的行级差异,cmp则用于逐字节比对任意文件(包括二进制),精度更高。

diff:对比文本文件的行变化

diff默认以“统一格式”(unified diff)输出,清晰标出哪些行被添加、删除或修改。适合代码、配置文件、日志等纯文本场景。

  • 基本用法:diff file1.txt file2.txt —— 显示差异行及上下文
  • 常用选项:-u(统一格式,推荐)、-r递归比较目录)、-q(仅报告是否不同,不显示详情)
  • 配合vimdiff可交互式查看并编辑差异,适合合并修改
  • 注意:diff会忽略空行、缩进或换行符差异(除非加-b-w等选项调整敏感度)

cmp:逐字节比对,精准判断二进制是否一致

cmp不关心文件内容是否“可读”,它把文件当作字节流处理,一旦发现第一个不同字节就停止,默认只报告位置和ASCII值。

  • 基本用法:cmp file1.bin file2.bin —— 若相同则无输出;不同则提示首个差异字节的偏移(从0开始)和对应字符
  • 常用选项:-l(列出所有不同字节的偏移与值)、-s(静默模式,仅通过退出码判断:0=相同,1=不同,2=错误)
  • 适合验证下载完整性、镜像文件一致性、编译前后二进制是否变化等场景
  • 不能直接看出“逻辑差异”,比如两个PNG图片视觉一样但IDAT块顺序不同,cmp仍会报不一致

怎么选?看文件类型和需求

不是“哪个更好”,而是“哪个更合适”:

  • 比对shell脚本、json、Markdown等——用diff -u
  • 确认两个tar包/ISO镜像/可执行文件是否完全一致——用cmp -s(配合if语句做自动化判断)
  • 想定位二进制中哪几个字节变了——用cmp -l | head
  • 需要可视化合并或打补丁——diff生成的.patch文件可被patch命令应用

小技巧:快速判断是否完全相同

除了cmp,还可以用校验和,但要注意适用场景:

  • cmp -s a b && echo “same” —— 零开销、最准确的全等判断
  • sha256sum a b | awk ‘{print $1}’ | sort -u | wc -l —— 若输出为1,说明哈希一致(但存在极小碰撞可能,且需计算整个文件)
  • diff对空文件或超大文件响应更快(可提前终止),cmp在首字节就不同情况下也极快
text=ZqhQzanResources