C#文件操作与ETW C#如何通过事件跟踪来分析文件IO性能

9次阅读

etw 无法直接显示 FileStream 托管层读写耗时,因其默认不采集 .net io 细粒度事件;需启用 microsoft-windows-dotnetruntime/io 提供程序或使用 dotnet-trace 工具捕获完整调用链。

C#文件操作与ETW C#如何通过事件跟踪来分析文件IO性能

ETW 事件里看不到 FileStream 的实际读写耗时?

因为 ETW 默认不采集托管和 .NET IO 方法的细粒度事件,FileStream.Read 这类调用会被归入内核 ZwReadFileNtWriteFile,但你看到的只是系统调用入口,不是托管层发起点。想关联到具体 C# 代码行,必须开启 .NET Runtime provider 并启用 Microsoft-Windows-DotNETRuntime/IO 事件(.NET 5+)或 Microsoft-Windows-DotNETRuntime/ThreadPool/IO(旧版)。

实操建议:

  • dotnet-trace 比直接用 logman 更可靠:它自动启用必要 provider,并支持按关键词过滤 IO 相关事件
  • 启动 trace 时加 --providers Microsoft-DotNETCore-EventPipe::0x1000000000000000:4(对应 IO 事件,Level=4 表示含详细参数)
  • 别依赖 Windows Kernel TraceDiskIO,它只反映物理层延迟,和你的 File.copy 是否用了缓冲区、是否异步无关

为什么 File.ReadAllBytes 在 ETW 里显示单次大 IO,而 FileStream 分成多段?

ETW 记录的是内核发起的 IRP 请求,不是托管 API 调用次数。File.ReadAllBytes 底层通常走 CreateFile + ReadFile 一次性提交,所以 ETW 中表现为一个长耗时的 IRP_MJ_READ;而 FileStream 默认缓冲区 4KB,每次 Read 触发一次内核请求(除非启用了 UseAsync=true 且底层支持),ETW 就会看到一串短 IO。

关键区别:

  • File.ReadAllBytes 的“快”是假象——它把所有开销压进一次系统调用,但内存分配、GC 压力全在托管侧,ETW 不体现
  • FileStream 的分段 IO 在 ETW 中更真实,但要注意:如果开了 Buffered=false,你会看到更多小 IO 和更高内核态切换开销
  • 对比性能不能只看 ETW 中的“IO 次数”,得结合 Microsoft-Windows-DotNETRuntime/GC 事件看内存压力

PerfView 分析时,File.Copy 的堆栈总停在 ntdll.dll!NtWriteFile

这是正常现象。.NET 的 File.Copy 在目标文件存在时默认走 CopyFileEx Win32 API,它内部由系统决定是否使用内存映射或直接内核拷贝,托管堆栈在进入 CopyFileEx 后就断了。你不会看到 File.CopyFileStream.Write 这样的链路。

排查方向:

  • 确认是否启用了 copyFlags 参数里的 COPY_FILE_NO_BUFFERING —— 它会让 ETW 显示更少但更大的 IO,但要求对齐 64KB,否则失败并回退
  • 检查源文件是否被其他进程锁住:ETW 中会出现 STATUS_SHARING_VIOLATION 错误码,但 PerfView 默认不显示错误码,需在 Events View 中右键列头添加 ErrorCode
  • 避免用 File.Copy 复制大文件到网络路径——ETW 会暴露大量 STATUS_PENDING 状态,说明 SMB 层在重试,这不是你代码的问题,但容易误判为 IO 卡顿

自定义 ETW provider 记录 FileStream 构造和 Dispose 时间点有用吗?

没用。ETW 是内核级事件通道,自定义 provider 无法安全捕获托管对象生命周期(比如 FileStream 析构可能发生在 GC 线程上,且无栈信息)。硬要打点,反而会拖慢 IO 路径,尤其在高并发文件写入场景下。

真正有效的做法:

  • EventSource 打点,但只记录关键业务节点:比如 “开始写入配置文件”、“写入完成耗时 234ms”,不记录每行 Write
  • FileStream 创建和 Dispose 时间差作为“句柄持有时间”,配合 ETW 中的 FileCreate/FileClose 事件交叉验证是否泄漏
  • 注意:.NET 6+ 的 FileStream 默认启用 Async,但 ETW 中的 AsyncIOStart 事件只在 BeginRead 类方法触发,ReadAsync 不发该事件——这是已知限制,别因此怀疑自己配置错了

ETW 文件 IO 分析最易忽略的一点:你看到的“慢 IO”,80% 情况下不是磁盘问题,而是文件被防病毒软件实时扫描、或 NTFS 加密/压缩属性导致额外 CPU 开销——这些在 ETW 中表现为 ZwWriteFile 返回慢,但没有对应事件告诉你“杀软正在读这个文件”。得靠 Process Monitor 配合过滤 Filesystem 类型操作来交叉确认。

text=ZqhQzanResources