Python如何去除字符串中的空格之间的_处理字符串中间空格的技巧

13次阅读

replace()适合简单统一替换,re.sub()更稳妥处理空格与下划线混杂场景;前者直接高效,后者灵活精准匹配复杂模式。

Python如何去除字符串中的空格之间的_处理字符串中间空格的技巧

replace() 直接替换所有空格和下划线

如果目标只是简单统一清理——比如把空格和 _ 都换成一个空格,或都删掉,replace() 最直接:

text = "hello__world  python  code" cleaned = text.replace(" ", "").replace("_", "") # → "helloworldpythoncode"

注意顺序:先换空格还是先换下划线不影响结果,但若想替换成其他分隔符(如 -),需避免重复替换,比如:

  • "a_b c".replace(" ", "-").replace("_", "-")"a-b-c"
  • "a_b c".replace("_", " ").replace(" ", "-") 会把原下划线变空格、再把所有空格(含新生成的)全变 -,结果一样;不过逻辑更绕,易出错

re.sub() 处理“空格与下划线混杂”的中间段

真实场景常遇到类似 "user__name is_valid" 这种:多个连续 _、多个空格、甚至二者交错。这时正则最稳妥:

import re text = "user__name  is_valid" cleaned = re.sub(r"[s_]+", " ", text).strip() # → "user name is valid"

[s_]+ 匹配一个或多个空白字符(含空格、制表符、换行)或下划线,统一替换成单个空格;.strip() 去首尾空格。

立即学习Python免费学习笔记(深入)”;

  • 若想彻底删除所有空格和下划线,用 re.sub(r"[s_]", "", text)
  • 若只处理字符串中间(保留首尾),得加边界判断,例如:re.sub(r"(?
  • 性能上,纯 replace() 比正则快,但可读性和鲁棒性差;混杂模式下别硬扛

split() + join() 实现“语义保留式”压缩

当空格/下划线本质是分词分隔符,且你希望保留单词边界(比如转成驼峰或 URL slug),split() 是更语义化的方式:

text = "  hello__world  python-code  " words = [w for w in re.split(r"[s_-]+", text) if w] # → ['hello', 'world', 'python', 'code'] slug = "-".join(words)  # → "hello-world-python-code" camel = words[0] + "".join(w.capitalize() for w in words[1:])  # → "helloWorldPythonCode"

关键点:

  • re.split()str.split() 更灵活,能同时切多种分隔符
  • if w 过滤空字符串(因首尾分隔符或连续分隔符导致)
  • 不用 text.replace("_", " ").split() ——它无法处理 - 或制表符,且对连续分隔符容错差

警惕 strip()isspace() 的隐含行为

strip() 默认只去首尾的空白字符(s),不碰下划线;而 isspace()"_" 返回 False,所以这类写法无效:

"a_b ".strip("_ ")  # → "a_b" ✅(去掉了尾部空格) "a_b_".strip("_ ")  # → "a_b" ✅(去掉了尾部下划线) " _a_b_ ".strip("_ ")  # → "a_b" ❌(首尾的 _ 和空格全被去掉,但中间的 _ 还在)

也就是说:strip() 只作用于两端,且传入的是“字符集合”,不是“子串”。容易误以为它能清理中间内容。

真正要判断某个字符是不是“空白或下划线”,得手动写:c in " tnrfv_" 或用正则 re.match(r"[s_]", c)

中间空格和下划线的混合清理,从来不是单个方法能兜底的事;关键是先明确需求:是格式化、分词、还是转义?选错起点,后面越写越补丁。

text=ZqhQzanResources