python转义字符_常见转义符列表、原始字符串与Unicode应用

4次阅读

python中反斜杠是字符串解析起点而非运行时转义，发生在编译阶段；应避免单个结尾、慎用r””处理路径，优先用pathlib或os.path.join，原始字符串与Unicode直写更安全可靠。

Python 中反斜杠不是“转义”而是“解析起点”

Python 解析字符串时，遇到就会尝试将其与后续字符组合成特殊含义（如 n、t），这个过程发生在字符串字面量被读入内存的**编译阶段**，不是运行时“转换”。所以问题本质不是“怎么转义”，而是“如何让不触发解析”。

常见错误现象："C:newtest.txt" 报错或路径乱码——因为 n 和 t 被解释为换行和制表符，实际传给系统的路径是

C:
ew est.txt

。

windows 路径、正则表达式、jsON 字符串中大量含，直接写双反斜杠 \ 最稳妥
不要依赖 ide 或 print() 输出判断：print() 显示的是“人类可读形式”，repr() 才反映真实内存内容
后跟非定义转义符（如 z）在 Python 3.12+ 会报 SyntaxWarning，但不会中断执行；旧版本静默忽略

原始字符串 `r""` 的边界条件必须清楚

原始字符串只是让失去转义能力，但它**不能以单个结尾**，否则语法错误。这不是限制，而是解析器无法区分“这反斜杠属于字符串末尾”还是“它想转义后面的引号”。

典型误用：r"C:temp" → SyntaxError: EOL while scanning String literal；r"abc" 同理报错。

立即学习“Python免费学习笔记（深入）”；

结尾需加空格或换行符再闭合引号：r"C:temp "（注意末尾空格）
更安全的做法是避免结尾：用 os.path.join("C:", "temp") 或 pathlib.Path("C:/temp")
原始字符串对换行符无效：r"abncd" 仍是 6 字符字符串（a b n c d），不是两行；若要保留真实换行，用三重引号 """abncd"""

Unicode 字符串不需要 `u` 转义也能直写，但要注意编码声明与终端支持

Python 3 默认所有字符串都是 Unicode，源文件中直接写中文、emoji（如 "你好?"）完全合法。所谓 u4f60 只是表示方式之一，不是“必须转义”。

容易踩的坑是：源文件保存为 GBK，但没声明编码，Python 尝试用 UTF-8 读取，导致 SyntaxError: Non-UTF-8 code starting with...。

如果必须用 u 表示，确保是小写 u + 4 位十六进制（u4f60），超 4 位用 U + 8 位（U0001F680）
windows 控制台默认不支持某些 Unicode 字符（如部分 emoji），print("?") 可能显示为空格或问号，这不是字符串问题，是终端渲染限制
写入文件时，显式指定 encoding="utf-8"（尤其跨平台时），避免依赖系统默认编码

混合使用原始字符串与 Unicode 的真实场景：正则匹配中文路径

处理 Windows 日志中的中文路径（如 日志错误2024-05.log）时，既要防止被转义，又要匹配 Unicode 字符，不能简单套用 r"" 或 u""（Python 3 中 u"" 已冗余）。

正确做法是：原始字符串 + Unicode 字符直写，或原始字符串 + u 编码，二者等价但前者更可读。

import re # ✅ 推荐：原始字符串内直写中文 pattern = r"日志\错误\[u4e00-u9fff]+.log" ✅ 等价但难读
pattern = r"u65e5u5fd7\u9519u8bef[u4e00-u9fff]+.log"
❌ 错误：非原始字符串，u 被当成普通字符
pattern = "日志错误[u4e00-u9fff]+.log"  # u 不会被识别为 Unicode 转义

关键点在于：原始字符串禁用解析，但不影响 u 作为正则语法的一部分（这里是 [u4e00-u9fff]，属于正则表达式引擎处理，不是 Python 字符串解析）。

真正容易被忽略的是：正则中的是给 re 模块用的，而字符串里的是给 Python 解析器用的——两层解析必须分开考虑。写错一层，整个模式就失效。

发表于：后端开发

近两天内

# ide # js # json # print # python # String # while # win # windows # 字符串 # 字符串解析 # 正则表达式 # 编码

复制链接

在 Go 中同时等待多个 Channel 的方法

Python文件系统遍历优化_性能说明【指导】

php如何格式化日期字符串？php日期与时间格式化函数详解

php方法怎么记_php常用函数记忆方法与技巧

PHP替换文件时如何防止重复_重复操作避免技巧【教程】

python转义字符_常见转义符列表、原始字符串与Unicode应用

Python 中反斜杠不是“转义”而是“解析起点”

原始字符串 `r""` 的边界条件必须清楚

Unicode 字符串不需要 `u` 转义也能直写，但要注意编码声明与终端支持

混合使用原始字符串与 Unicode 的真实场景：正则匹配中文路径

✅ 等价但难读

❌ 错误：非原始字符串，u 被当成普通字符

如何在 Android 设备中正确链接 HTML 的 CSS 样式表

如何在 Next.js 中正确使用环境变量避免水合错误与登录跳转问题

css grid如何实现内容自适应填充网格_利用auto-fill和minmax函数

Sublime如何设置自动保存代码 Sublime实时保存功能开启【技巧】

nft list ruleset 不显示新规则的 table/chain/优先级冲突

如何在 Go 中确保 JSON 反序列化后 map 的键顺序一致？

Go 中字符串减法运算的正确替代方案

Laravel 9+ 中 AJAX 请求的 CSRF Token 管理最佳实践

Linux 灰度发布过程中的风险控制

TypeScript 中 keyof 在嵌套映射类型中的误用与正确实践

python转义字符_常见转义符列表、原始字符串与Unicode应用

Python 中反斜杠 不是“转义”而是“解析起点”

原始字符串 r"" 的边界条件必须清楚

Unicode 字符串不需要 u 转义也能直写，但要注意编码声明与终端支持

混合使用原始字符串与 Unicode 的真实场景：正则匹配中文路径

✅ 等价但难读

❌ 错误：非原始字符串，u 被当成普通字符

Python 中反斜杠不是“转义”而是“解析起点”

原始字符串 `r""` 的边界条件必须清楚

Unicode 字符串不需要 `u` 转义也能直写，但要注意编码声明与终端支持