Python 中将 ISO 8601 时间戳转换为日期并计算日期差值的完整教程

17次阅读

Python 中将 ISO 8601 时间戳转换为日期并计算日期差值的完整教程

本文详解如何使用 pandas 将形如 `2024-02-06t00:00:00.000z` 的 iso 8601 字符串列正确解析为带时区的 datetime 类型,并安全计算两列日期间的天数差(支持负值),避免 `typeerror: unsupported operand type(s) for -: ‘str’ and ‘str’`。

在处理真实业务数据(如 API 响应、日志或数据库导出)时,时间字段常以 ISO 8601 格式字符串存储,例如 ‘2024-02-06T00:00:00.000Z’。这类字符串不能直接参与数学运算——若尝试对两个 str 类型列执行减法(如 df[‘A’] – df[‘B’]),python 会抛出 TypeError,正如问题中所示。

核心解决步骤只有三步:解析 → 验证 → 计算

✅ 第一步:用 pd.to_datetime() 安全解析时间字符串

pandas.to_datetime() 是处理此类格式的首选工具。它能自动识别 T 和 Z(表示 UTC 时区),无需手动指定格式字符串(如 %Y-%m-%dT%H:%M:%S.%fZ),且对缺失值、空字符串等具有鲁棒性(可通过 errors=’coerce’ 统一转为 NaT):

df['Schedule_Date'] = pd.to_datetime(df['Schedule_Date']) df['Out_Date'] = pd.to_datetime(df['Out_Date'])

执行后,列类型变为 datetime64[ns, UTC](注意 +00:00 时区标识),具备完整的 datetime 运算能力。

立即学习Python免费学习笔记(深入)”;

✅ 第二步:验证解析结果(推荐)

建议添加检查,确认无解析失败:

print(df[['Schedule_Date', 'Out_Date']].dtypes) # 输出应为: # Schedule_Date    datetime64[ns, UTC] # Out_Date         datetime64[ns, UTC]  # 检查是否存在 NaT(未成功解析的值) print(df['Schedule_Date'].isna().sum(), df['Out_Date'].isna().sum())

✅ 第三步:计算日期差并提取天数

对两个 datetime 列相减,返回 timedelta64[ns] 类型的 Series;调用 .dt.days 即可获取整数天数(负值表示后者早于前者):

df['days_alert'] = (df['Out_Date'] - df['Schedule_Date']).dt.days

⚠️ 注意:.dt.days 仅返回完整天数(截断小数部分)。若需包含小时/分钟的精确差值,可用 .dt.total_seconds() / 86400。

? 完整可运行示例

import pandas as pd  data = {     'ID': ['089', '983', '037', '654'],     'Schedule_Date': ['2024-02-06T00:00:00.000Z', '2024-03-17T00:00:00.000Z',                        '2024-02-02T00:00:00.000Z', '2024-08-14T00:00:00.000Z'],     'Out_Date': ['2024-02-08T00:00:00.000Z', '2024-04-27T00:00:00.000Z',                   '2024-05-24T00:00:00.000Z', '2024-02-26T00:00:00.000Z'] } df = pd.DataFrame(data, index=['rank1', 'rank2', 'rank3', 'rank4'])  # 关键:解析为 datetime(自动识别 Z 为 UTC) df['Schedule_Date'] = pd.to_datetime(df['Schedule_Date']) df['Out_Date'] = pd.to_datetime(df['Out_Date'])  # 计算天数差 df['days_alert'] = (df['Out_Date'] - df['Schedule_Date']).dt.days  print(df[['ID', 'Schedule_Date', 'Out_Date', 'days_alert']])

? 补充技巧

  • 忽略时区,只取日期部分:若只需年月日差(忽略时分秒和时区),可链式调用 .dt.date,但注意这会丢失时区信息且返回 Python date 对象(不支持 .dt 访问器):
    df['Schedule_Date'].dt.date  # → Series of datetime.date
  • 统一转换为本地时区:如需转为系统本地时区,用 .dt.tz_convert(‘Asia/Shanghai‘)。
  • 批量处理多列:可用 df[[‘col1′,’col2’]] = df[[‘col1′,’col2’]].apply(pd.to_datetime)。

掌握 pd.to_datetime() 这一核心方法,即可高效、可靠地处理绝大多数时间字符串解析与差值计算场景。

text=ZqhQzanResources