解决Pandas DataFrame新增列在df.info()中不显示的问题

43次阅读

本文探讨了pandas dataframe中新增列如’total’或索引列在`df.info()`输出中缺失的常见原因及解决方案。核心在于确保代码执行顺序正确，即列创建操作先于`df.info()`。同时，介绍了如何通过`df.reset_index()`将索引转换为普通列，并澄清了`inplace=true`在此场景下的误解。通过遵循正确的操作流程，可确保dataframe结构信息准确反映最新状态。

在数据分析和处理过程中，Pandas DataFrame是不可或缺的工具。df.info()方法提供了一个快速概览DataFrame结构、列名、非空值数量和数据类型的功能，对于理解数据集至关重要。然而，有时用户会发现，即使已经成功添加了新列并确认其存在于DataFrame中，df.info()的输出却未能显示这些新列。本教程将深入分析导致此问题的原因，并提供详细的解决方案。

理解 df.info() 的作用

df.info()函数在执行时会检查并报告当前DataFrame对象的状态。它会遍历DataFrame的列，统计每列的非空值数量和数据类型。因此，如果某个列在df.info()被调用时尚未添加到DataFrame中，或者DataFrame对象本身并未更新到包含新列的状态，那么该列自然不会出现在输出中。

新增列未显示在 df.info() 中的原因及对策

导致新列在df.info()中不显示的根本原因通常与代码的执行顺序或对DataFrame结构的理解有关。

1. 执行顺序问题

这是最常见的原因。如果你在创建新列（例如df[‘Total’] = …）的代码之前调用了df.info()，那么df.info()将只会反映旧的DataFrame状态。

示例场景：

import pandas as pd  # 假设有一个初始DataFrame data = {'H1': [1.64e10, 3.87e9, 2.12e10, 3.91e9],         'H2': [5.40e9, 1.05e10, 1.07e9, 3.30e9],         'H3': [1.09e9, 6.15e9, 2.85e8, 8.17e7]} index_labels = ['A', 'B', 'C', 'D'] df = pd.DataFrame(data, index=index_labels)  print("--- 第一次 df.info() ---") df.info() # 此时'Total'列尚未创建，df.info()不会显示它  # 创建'Total'列 df['Total'] = df[list(df.columns)].sum(axis=1)  print("n--- DataFrame head() 确认'Total'列已存在 ---") print(df.head())  print("n--- 第二次 df.info() ---") df.info() # 'Total'列现在应该会显示

对策：

Reachout.ai

一个ai驱动的视频开发平台，专为忙碌的企业家和销售团队打造

142

查看详情

确保创建新列的代码逻辑在调用df.info()之前执行。在jupyter Notebook或类似的交互式环境中，如果遇到此问题，尝试重启内核（Restart Kernel）并重新运行所有单元格（Run All Cells），以确保所有操作都按照正确的顺序执行。

2. 索引列的处理

用户有时会遇到DataFrame的索引（如示例中的’A’, ‘B’, ‘C’, ‘D’）没有显示在df.info()输出中的情况。这是因为Pandas DataFrame的索引默认不被视为常规的数据列。df.info()只报告数据列的信息。

对策：

如果你需要将索引作为常规列进行操作或在df.info()中查看其信息，可以使用df.reset_index()方法将其转换为一列。

示例代码：

import pandas as pd  # 假设有一个初始DataFrame data = {'H1': [1.64e10, 3.87e9, 2.12e10, 3.91e9],         'H2': [5.40e9, 1.05e10, 1.07e9, 3.30e9],         'H3': [1.09e9, 6.15e9, 2.85e8, 8.17e7]} index_labels = ['A', 'B', 'C', 'D'] df = pd.DataFrame(data, index=index_labels)  print("--- 原始 df.info() (索引未作为列) ---") df.info()  # 将索引转换为列 df = df.reset_index() # reset_index() 默认会创建一个名为 'index' 的新列  print("n--- 转换索引后 df.head() ---") print(df.head())  print("n--- 转换索引后 df.info() ---") df.info()  # 现在可以安全地创建'Total'列，并确保所有列都显示 df['Total'] = df[['H1', 'H2', 'H3']].sum(axis=1) # 注意这里需要排除新的'index'列 print("n--- 添加'Total'列后 df.info() ---") df.info()

注意事项： 当使用df.reset_index()后，原索引会变成名为’index’的新列（除非指定name参数）。在后续计算如df[list(df.columns)].sum(axis=1)时，需要注意是否将这个新生成的’index’列也包含在计算中。通常情况下，求和操作应只针对数值列。

3. 关于 inplace=True 的澄清

在Pandas中，许多操作都有一个inplace参数，用于决定是否在原地修改DataFrame。例如，df.drop(columns=[‘OldCol’], inplace=True)会直接修改df。然而，对于像df[‘Total’] = …这样直接给新列赋值的操作，它本身就是原地修改DataFrame，不需要也不支持inplace=True参数。尝试使用inplace=True反而会导致语法错误。

因此，当你在创建新列时，无需担心inplace=True的问题，因为赋值操作本身就完成了对DataFrame的更新。

验证列存在的其他方法

除了df.info()之外，还有多种方法可以验证DataFrame中列的存在性：

df.head() 或 df.tail(): 直接打印DataFrame的头部或尾部，可以直观地看到所有列，包括新添加的列。
df.columns: 返回一个包含所有列名的Index对象。你可以检查新列名是否包含在其中。
```
print(df.columns)
```
df.describe(): 对于数值型列，df.describe()会提供描述性统计信息。如果新列是数值型的，它应该会出现在df.describe()的输出中。
```
print(df.describe())
```

总结与最佳实践

要确保Pandas DataFrame中新增的列能够正确显示在df.info()的输出中，核心在于遵循逻辑清晰的代码执行流程：

明确操作顺序：始终确保新列的创建代码在任何需要反映这些新列的DataFrame信息查询（如df.info()）之前执行。
处理索引：如果需要将索引作为数据列处理，请使用df.reset_index()将其转换为常规列。
理解赋值操作：df[‘NewColumn’] = …这样的赋值操作会直接修改DataFrame，无需inplace=True。
多重验证：结合使用df.head()、df.columns和df.describe()等方法，可以更全面地验证DataFrame的结构和内容。

通过遵循这些原则，你可以有效地管理Pandas DataFrame的结构，并确保df.info()始终提供最新、最准确的DataFrame概览。

发表于：后端开发

2025-12-14

# ai # jupyter # pandas # 对象 # 工具 # 数据分析 # 数据类型

复制链接

PHP：实现基于月日的日期范围判断（忽略年份）

PHP解析上传的XML SimpleXML如何加载临时文件

PHP数据怎么去重算法_PHP数据去重算法实现方法及效率优化。

C# XML解析代码重构指南如何让你的代码更清晰、更不易出错

sublime如何配置Stylelint自动检查和修复CSS/SCSS？ (前端必备)

解决Pandas DataFrame新增列在df.info()中不显示的问题

理解 df.info() 的作用

新增列未显示在 df.info() 中的原因及对策

1. 执行顺序问题

2. 索引列的处理

3. 关于 inplace=True 的澄清

验证列存在的其他方法

总结与最佳实践

PHP框架里队列任务怎么发_异步处理高频功能操作说明【操作】

HTML 中相对路径导致资源请求地址错误的解决方案

Python 为什么不需要手动释放内存？

PHP怎么隐藏错误信息不显示_PHP错误报告设置方法【解答】

mysql索引和缓存如何配合_mysql性能提升策略

怎么安装Composer_PHP包管理器安装使用【详解】

Java的org.w3c.dom包里有什么

mysql使用OOP思想有哪些优势_mysql项目实践经验总结

Laravel怎么实现第三方登录_Laravel使用Socialite集成GitHub/QQ【实战】

c++如何进行二进制文件读写_c++ write和read方法【核心】