Python时间格式解析失败_strptime错误排查

3次阅读

python中strptime报错主因是时间字符串与格式码不匹配,需检查隐藏字符、严格核对格式码、区分strptime与dateutil.parser适用场景,并用try/except精准捕获错误。

Python时间格式解析失败_strptime错误排查

Python中strptime报错,通常是因为输入字符串与指定格式不匹配——不是代码写错了,而是时间字符串本身和格式码对不上。

检查时间字符串是否含不可见字符

从网页、excel或日志中复制的时间字符串,常带空格、制表符、零宽空格或bom头。比如"2023-10-05 "(末尾有不间断空格)或"ufeff2023-10-05"(UTF-8 BOM),都会导致strptime直接抛ValueError

  • repr(s)打印原始字符串,查看是否有xu等转义字符
  • 预处理时用s.strip()清除首尾空白,再用s.replace('u200b', '').replace('ufeff', '')清理常见隐藏符
  • 读文件时指定encoding='utf-8-sig',自动剥离BOM

核对格式码与实际内容是否严格一致

%Y要4位年份,%y要2位;%H是24小时制,%I是12小时制且需搭配%p;月份%m必须是01–12的两位数,不能是”1″或”Jan”。

  • 中文日期如”2023年10月05日”,格式应为"%Y年%m月%d日",不能漏掉“年”“月”“日”字
  • 带毫秒的"2023-10-05 14:30:45.123",要用"%Y-%m-%d %H:%M:%S.%f"%f必须是6位数字(不足补0)
  • 星期几、月份名等本地化内容(如”十月”、”星期四”)默认不支持,需用locale.setlocale()并确保系统locale可用

区分strptimedateutil.parser的适用场景

strptime要求格式完全确定、性能高;而真实数据往往格式混杂(如”2023/10/5″、”5-Oct-2023″、”2023-10-05T14:30:45Z”并存),硬写格式易出错。

立即学习Python免费学习笔记(深入)”;

  • 开发阶段快速解析不确定格式,优先用dateutil.parser.parse(s),它自带启发式推断
  • 生产环境需稳定性和可预测性,仍建议用strptime,但先用正则或try/except做前置校验
  • 混合场景可先用parser.parse兜底,再转成datetime对象统一处理

try/except捕获并定位具体失败点

不要让一个解析失败中断整个流程。把错误信息打详细,能快速判断是哪条数据、哪个字段、哪个格式环节出问题。

  • 捕获ValueError,打印repr(输入字符串)格式串
  • 对批量数据加行号或ID标识,例如for i, s in enumerate(time_list): try: ... except ValueError as e: print(f"第{i}项'{repr(s)}'解析失败:{e}")
  • 记录失败样本到文件,便于后续补全格式规则或清洗逻辑
text=ZqhQzanResources