pandas 如何在 pivot_table 里对缺失值做不同填充策略

11次阅读

pandas.pivot_table中缺失值处理需分场景：fill_value仅填充未出现的行列组合；常用fillna对结果灵活填充；也可在aggfunc中定制聚合逻辑；margins行同样受fill_value影响。

在 pandas.pivot_table 中，缺失值（NaN）的填充不能直接通过 pivot_table 参数完成，而是需要在调用后或通过 aggfunc 配合自定义函数间接实现。核心思路是：先生成透视表，再对结果中的 NaN 做填充；或在聚合阶段就控制缺失值的处理逻辑。

fill_value 是 pivot_table 唯一原生支持的缺失值处理参数，适用于所有未覆盖单元格（即组合不存在时），用指定值替换 NaN：

只影响“完全未出现的行列组合”，不处理聚合结果本身为 NaN 的情况（如某组全为 NaN）
接受数字、字符串、None 等，例如 fill_value=0、fill_value="N/A"
示例：pd.pivot_table(df, values='sales', index='region', columns='month', fill_value=0)

更常用也更可控的方式：生成 pivot_table 后，对返回的 DataFrame 或 Series 调用 fillna()，支持多种策略：

注意：若 pivot_table 返回的是 MultiIndex DataFrame，fillna 仍可正常作用于数值列。

对聚合过程本身定制处理，比如跳过 NaN、返回特定默认值，或按组内统计量填充：

用 Lambda 包裹内置函数：如 aggfunc=lambda x: np.nanmean(x) if not x.isna().all() else -1
结合 skipna=False 强制保留 NaN，再后续统一处理
使用 pd.NamedAgg 对不同列应用不同逻辑，例如销售额用均值，订单数用 0 填充

开启 margins=True 后，小计行/列也可能含 NaN。此时 fill_value 同样生效，但要注意：

发表于：php框架

2026-01-16

复制链接

Go并发编程中channel缓冲区怎么选_缓冲与无缓冲区别

如何在 Discord Bot 中正确实现敏感词检测与消息拦截