Python Pandas 时间序列处理技巧

7次阅读

pandas时间序列分析核心是“时间索引→对齐→重采样→滚动计算”主线：需用to_datetime+set_index设时间索引，resample精准按周期重采样，rolling(‘7d’)配合closed参数控制时点对齐，时区处理须先localize再convert。

处理时间序列数据是 Pandas 最核心也最常用的能力之一。关键不在于记住所有函数，而在于理清“时间索引→对齐→重采样→滚动计算”这条主线，再配合合理的时区与频率设置。

用 pd.to_datetime() 转换列后，必须用 set_index() 显式设为索引，否则无法触发 Pandas 的时间序列智能操作：

避免直接写 df['date'] = pd.to_datetime(df['date']) 就停住——这仅是普通列
正确做法：df = df.assign(date=pd.to_datetime(df['date'])).set_index('date')
设好后检查：df.index.dtype 应为 datetime64[ns]，且 df.index.freq 可能自动推断出频率（如 ‘D’、’H’）

resample() 是专为时间索引设计的分组工具，会自动对齐边界、填充缺失区间，比基于字符串或截取日期的 groupby() 更可靠：

rolling() 默认按行数滚动（如 rolling(7)），但时间序列更常用时间窗口（如 rolling('7D')），此时 closed 参数决定是否包含当前时刻：

带时区的时间序列必须分两步走，否则会报 Cannot localize tz-aware datetime 错误：

不复杂但容易忽略。把索引设对、频率理清、重采样用准、滚动窗闭合方向选好，时序分析就稳了一大半。

发表于：后端开发

2026-02-27

复制链接

CSS浮动布局的历史演进_从图文环绕到网页骨架的变迁

CSS如何控制弹性布局中的文本书写模式_配合writing-mode实现垂直flex