PythonNumPy教程_数组计算与向量化操作

9次阅读

numpy的核心优势在于高效数组计算和向量化操作,支持广播、布尔索引、轴向聚合等机制,大幅提升性能与可读性。

PythonNumPy教程_数组计算与向量化操作

NumPy 的核心优势在于高效数组计算和向量化操作——它让原本需要循环的逐元素运算,变成一行代码就能完成的批量处理,速度快、代码简、可读性强。

数组创建与基础属性

掌握数组的生成方式和关键属性是向量化操作的前提。常用创建方式包括 np.Array()(从列表/元组转换)、np.zeros()np.ones()np.arange()np.linspace()

  • shape 返回维度大小,如 (3, 4) 表示 3 行 4 列
  • dtype 指明数据类型,如 int64float32,影响内存占用和计算精度
  • ndim 表示数组维数,标量为 0,一维数组为 1,二维为 2
  • 修改 reshape() 可在不复制数据的前提下改变结构,例如 a.reshape(2, -1) 自动推导列数

向量化运算:告别 for 循环

NumPy 对数组直接支持加减乘除、幂、三角函数等运算,这些操作自动广播到每个元素,底层用 C 实现,远快于 python 循环。

  • 两个相同形状数组相加:a + b 是逐元素相加,不是拼接
  • 标量与数组运算会自动广播,如 a * 2.5 把每个元素乘以 2.5
  • 不同形状数组也可运算,只要满足广播规则(从后往前比对维度,某维为 1 或相等即可),例如 (4, 1) 数组可与 (1, 3) 相加,结果为 (4, 3)
  • 常用向量化函数:np.sin()np.exp()np.log()np.maximum(a, b)

索引、切片与布尔索引

灵活选取数据是分析的关键,NumPy 提供多种高效索引方式,全部返回视图(不复制数据),节省内存。

立即学习Python免费学习笔记(深入)”;

  • 普通切片如 a[1:4, 2] 支持步长、负索引,且修改会影响原数组
  • 整数数组索引可按指定顺序提取行或列,如 a[[0, 2, 1]] 重排第 0、2、1 行
  • 布尔索引最实用:用条件表达式生成 True/False 数组,直接筛选,如 a[a > 0] 取所有正数;a[(a > 1) & (a 注意用 & 而非 and
  • np.where() 可返回满足条件的索引位置,也支持三元选择:np.where(a > 0, a, 0) 将负数变 0

聚合函数与轴向操作

统计类计算(如求和、均值、最大值)默认作用于整个数组,但通过 axis 参数可指定沿哪一维进行,这是多维数据分析的核心。

  • axis=0 表示按列操作(压缩行),axis=1 表示按行操作(压缩列)
  • 例如二维数组 bb.sum(axis=0) 返回每列之和,长度等于列数
  • 常用函数都支持 axiskeepdims=True(保持维度,方便后续广播)
  • np.argmax()np.argmin() 返回最大/最小值的索引位置,配合 axis 可定位每行最大值所在列号

向量化不是炫技,而是 NumPy 发挥性能和表达力的基础。写好数组形状、理解广播机制、善用布尔索引和轴向聚合,就能把多数数据分析任务从繁琐循环中解放出来。

text=ZqhQzanResources