scandir()最直接但需手动过滤.和..并注意自然排序;递归推荐recursivedirectoryiterator+recursiveiteratoriterator,启用skip_dots并用try/catch捕获权限异常;glob()内存占用高且不健壮。

用 scandir() 获取目录内容但要注意排序和隐藏文件
scandir() 是最直接的内置函数,返回包含当前目录下所有条目(包括 . 和 ..)的数组,默认按字母升序排列。它不递归,只看一层。
- 必须手动过滤掉
.和..,否则后续is_dir()或is_file()可能出错 - 注意系统可能返回隐藏文件(如
.gitignore),如果业务不需要,得用array_filter()配合str_starts_with($name, '.') === false - 排序是字符串级的,
file10.txt会排在file2.txt前面,如需自然排序,得用natcasesort()重排数组
递归遍历用 RecursiveDirectoryIterator + RecursiveIteratorIterator
这是 php 原生推荐的递归方式,比手写递归更健壮,自动跳过无法访问的子目录(如权限不足),且支持 SKIP_DOTS 标志省去手动过滤。
- 初始化时传入
FilesystemIterator::SKIP_DOTS,可直接排除.和.. - 遍历时用
getFilename()拿文件名,getPathname()拿完整路径,isFile()/isDir()判断类型 - 若需限制深度(比如最多进 3 层子目录),可在构造
RecursiveIteratorIterator时传入第三个参数RecursiveIteratorIterator::SELF_FIRST并配合计数器控制
$iter = new RecursiveIteratorIterator( new RecursiveDirectoryIterator('/path', FilesystemIterator::SKIP_DOTS), RecursiveIteratorIterator::LEAVES_ONLY ); foreach ($iter as $file) { echo $file->getPathname() . "n"; }
遇到 Permission denied 错误时别让脚本崩掉
遍历中碰到无读取权限的目录(如 /proc 下某些子目录),RecursiveDirectoryIterator 默认抛出 UnexpectedValueException,导致整个循环中断。
- 必须用
try/catch包裹迭代过程,捕获UnexpectedValueException并继续下一次迭代 - 不要用
@抑制错误——它无法屏蔽迭代器内部异常,且掩盖问题 - 若需记录哪些路径被跳过,可在
catch块里写日志,例如error_log("Skip: " . $e->getMessage());
大目录下性能差异:用 glob() 还是迭代器?
glob('/path/*') 看起来简洁,但它一次性把所有匹配结果加载进内存,且不支持递归(除非嵌套调用,逻辑复杂)。对含上万文件的目录,容易内存溢出或超时。
立即学习“PHP免费学习笔记(深入)”;
-
RecursiveDirectoryIterator是惰性迭代,每次只取一个条目,内存占用稳定 -
glob()在路径中使用**(如glob('/path/**/*', GLOB_BRACE))需要 PHP ≥ 7.3 且开启glob()的GLOB_BRACE支持,兼容性不如迭代器 - 如果只是找特定后缀文件(如所有
.log),用RegexIterator包裹迭代器比glob()更可控、更省内存
实际递归遍历的健壮写法,往往就卡在权限处理和内存控制这两处。漏掉 SKIP_DOTS 或没包 try/catch,线上一跑就挂;而盲目用 glob() 处理海量小文件,可能让脚本在半路 OOM。