用 TextFieldParser 读 csv 更安全,它能正确处理含逗号、换行、引号的字段;写 CSV 需手动 RFC 4180 转义并加 bom 才能被 excel 正确识别。

用 TextFieldParser 读 CSV 更安全,别手写字符串分割
手动 Split(',') 会崩在带逗号、换行、引号的字段上(比如地址字段 "Beijing, China" 或多行备注)。.net 自带的 microsoft.VisualBasic.FileIO.TextFieldParser 能正确处理转义和引号包裹,即使项目是 C# 也能用——只需引用 Microsoft.VisualBasic 程序集(.NET Core/.NET 5+ 已内置,无需额外 NuGet)。
常见错误:漏掉 SetDelimiters(",") 或没设 HasFieldsEnclosedInQuotes = true,导致解析失败或字段错位。
- 必须调用
parser.SetDelimiters(","),否则默认按制表符分隔 - 含引号字段(如
"John ""The Boss"" Doe")需开启HasFieldsEnclosedInQuotes = true - 遇到空行或注释行,检查
parser.CommentTokens和parser.TextFieldType
using Microsoft.VisualBasic.FileIO; // ... using (var parser = new TextFieldParser("data.csv")) { parser.SetDelimiters(","); parser.HasFieldsEnclosedInQuotes = true; while (!parser.EndOfData) { String[] fields = parser.ReadFields(); Console.WriteLine(string.Join("|", fields)); } }
写 CSV 用 streamWriter + 手动转义,别直接 WriteLine
没有内置“一键写 CSV”的 API。直接 sw.WriteLine(string.Join(",", values)) 在值含逗号、引号或换行时会破坏格式。必须对每个字段做 RFC 4180 兼容转义:字段含 ,、" 或 n 时,用双引号包裹,并将内部引号替换成两个引号(" → "")。
性能提示:不要为每行都新建 StreamWriter;打开一次,循环写入。
using (var sw = new StreamWriter("output.csv", false, Encoding.UTF8)) { foreach (var row in data) { var escaped = row.Select(field => { if (string.IsNULLOrEmpty(field) || field.IndexOfAny(new char[] { ',', '"', 'n', 'r' }) == -1) return field; return $""{field.Replace(""", """")}""; }); sw.WriteLine(string.Join(",", escaped)); } }
第三方库选 CsvHelper,但注意配置陷阱
CsvHelper 是最常用的 C# CSV 库,支持类型映射、自动转义、自定义分隔符。但它默认不处理 BOM,且对 null 值、空字符串、日期格式敏感,容易导出后 Excel 打不开或数据错列。
典型问题:用 GetRecords 读取时字段名大小写不匹配、类型转换失败抛异常;写入时没设 ShouldQuote 导致引号丢失。
- 读取前务必调用
csv.Configuration.Delimiter = ","和csv.Configuration.HasHeaderRecord = true - 写入时启用 BOM:
new StreamWriter("out.csv", false, Encoding.UTF8)(CsvWriter不自动加) - 字段含换行符?确保
csv.Configuration.ShouldQuote = args => true强制所有字段加引号
Excel 打不开 CSV?大概率是编码或 BOM 问题
windows 上 Excel 默认用系统本地编码(如 GB2312)打开 CSV,UTF-8 无 BOM 的文件常显示乱码。这不是 CSV 格式错,而是编码声明缺失。
解决方法只有两个:要么保存为 UTF-8 with BOM,要么改用 ANSI 编码(不推荐,中文易损)。
- 写文件时用
new UTF8Encoding(true)(true表示写 BOM) - 别依赖
Encoding.UTF8默认构造函数——它不写 BOM - 用记事本另存为“UTF-8”时,实际写的是带 BOM 的 UTF-8;VS 或代码里不用这个构造,Excel 就认不出
var bomUtf8 = new UTF8Encoding(true); // 注意这个 true using (var sw = new StreamWriter("excel-friendly.csv", false, bomUtf8)) { // ... 写内容 }
BOM 和字段转义是绝大多数人卡住的地方,不是语法不会,是不知道 Excel 和 RFC 对“合法 CSV”的要求比直觉严格得多。