深入理解NumPy数组索引：避免np.argwhere在多维数组赋值中的陷阱

2次阅读

本教程旨在解析numpy中`np.argwhere`函数在使用多维数组进行元素赋值时可能导致的常见错误。我们将详细解释`np.argwhere`返回的坐标数组与numpy高级索引机制之间的差异，并通过示例代码演示为何直接使用`np.argwhere`的输出进行赋值会导致意料之外的结果。最终，文章将推荐并展示如何利用布尔掩码（Boolean masking）这一更高效、更直观的方法来实现条件性数组元素赋值，以确保代码的正确性和性能。

理解NumPy中的数组索引与np.argwhere

在NumPy中，对数组元素进行选择和赋值是核心操作之一。NumPy提供了多种索引方式，包括基本切片、整数数组索引和布尔数组索引（即布尔掩码）。其中，np.argwhere是一个非常有用的函数，它返回满足给定条件的元素的坐标。然而，在使用np.argwhere的输出直接对多维数组进行赋值时，常常会遇到与预期不符的结果。

np.argwhere的工作原理

np.argwhere(condition)函数会返回一个N维数组，其中每一行代表一个满足条件的元素的完整坐标。例如，对于一个2D数组，np.argwhere会返回一个形如[[row1, col1], [row2, col2], …]的数组。

让我们通过一个简单的例子来理解这一点：

import numpy as np  test = np.array([[1, 2],                  [3, 4]])  # 查找值为3的元素的坐标 where_3 = np.argwhere(test == 3) print("np.argwhere(test == 3) 的结果:n", where_3)

输出:

np.argwhere(test == 3) 的结果:  [[1 0]]

这表明值为3的元素位于test[1, 0]。

np.argwhere输出作为索引的陷阱

问题在于，当我们将np.argwhere返回的这种2D坐标数组直接用作另一个2D数组的索引时，NumPy的高级索引规则会将其解释为沿第一个维度（行）进行选择，而不是选择特定的(行, 列)元素。

继续上面的例子，如果我们尝试使用where_3来索引test数组：

print("test[where_3] 的结果:n", test[where_3])

输出:

test[where_3] 的结果:  [[[3 4]    [1 2]]]

我们期望的是只获取到test[1, 0]，即值3。但实际结果是[[[3 4] [1 2]]]，这是一个包含两行的2D数组（尽管形状显示为3D，这是因为索引数组本身是2D的）。这实际上是test[[1, 0]]的结果，即选择了test数组的第1行和第0行。NumPy将where_3中的每一行[r, c]都视为一个单独的索引，应用于目标数组的第一个维度。

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

4061

查看详情

因此，如果您的目标是根据np.argwhere找到的特定(行, 列)坐标来修改元素，直接使用np.argwhere的输出作为索引将无法达到预期效果。这通常是导致数组元素赋值错误的原因。

正确的姿势：利用布尔掩码进行条件赋值

对于基于条件对NumPy数组元素进行赋值的场景，最推荐和最有效的方法是使用布尔掩码（Boolean Masking）。布尔掩码是一个与原数组形状相同的布尔类型数组，其中True表示对应位置的元素满足条件，False则不满足。当布尔掩码用于索引时，NumPy会选择所有对应位置为True的元素。

使用布尔掩码进行条件赋值的优势在于：

直观性： 代码更易读，直接表达了“在满足某个条件的这些位置上进行操作”。
效率： NumPy底层针对布尔索引进行了高度优化，通常比使用np.argwhere获取坐标后再进行迭代或复杂的整数索引更快。
简洁性： 无需额外的步骤来处理坐标，直接生成掩码即可。

示例：使用布尔掩码解决阈值化问题

假设我们有一个gradIntensity2数组，需要根据不同的阈值对其进行二值化处理。原始代码尝试使用np.argwhere，但导致了错误的结果。现在，我们将其改写为使用布尔掩码。

import numpy as np  # 模拟原始数据 gradIntensity2 = np.random.rand(5, 5) * 500 # 假设是一个5x5的梯度强度数组 print("原始 gradIntensity2:n", gradIntensity2)  maxVal = np.max(gradIntensity2) thrGradIntensity = gradIntensity2.copy() # 创建副本进行操作  highThr = maxVal / 5 lowThr = maxVal / 40  print(f"n最大值 (maxVal): {maxVal:.2f}") print(f"高阈值 (highThr): {highThr:.2f}") print(f"低阈值 (lowThr): {lowThr:.2f}")  # --- 使用布尔掩码进行条件赋值 ---  # 条件1: 强度大于等于高阈值 indHT = gradIntensity2 >= highThr # 条件2: 强度小于等于低阈值 indLT = gradIntensity2 <= lowThr # 条件3: 强度介于低阈值和高阈值之间 (不包括两端) ind = (lowThr < gradIntensity2) & (gradIntensity2 < highThr)  # 根据布尔掩码直接赋值 thrGradIntensity[indHT] = 1 thrGradIntensity[indLT] = 0 thrGradIntensity[ind] = 0.5  print("n处理后的 thrGradIntensity:n", thrGradIntensity)  # 验证结果 print(f"n处理后 thrGradIntensity 的最大值: {np.max(thrGradIntensity)}") print(f"是否存在值为1的元素: {np.any(thrGradIntensity == 1)}") print(f"是否存在值为0的元素: {np.any(thrGradIntensity == 0)}") print(f"是否存在值为0.5的元素: {np.any(thrGradIntensity == 0.5)}")

代码解释：

indHT = gradIntensity2 >= highThr: 这直接生成了一个布尔数组indHT，其中gradIntensity2中所有大于等于highThr的位置为True，其余为False。
thrGradIntensity[indHT] = 1: 当我们使用这个布尔数组作为索引时，NumPy会自动选择indHT中所有True对应的thrGradIntensity元素，并将它们赋值为1。
indLT和ind的生成及赋值方式同理。&运算符用于组合布尔条件（对应逻辑AND）。

通过这种方式，我们可以确保每个条件都正确地应用于相应的元素，并且赋值操作能够准确地修改预期的位置。最终，np.max(thrGradIntensity)将正确地显示1（如果存在满足highThr条件的元素），而不是0.5。

总结与最佳实践

np.argwhere的用途： np.argwhere主要用于当你需要获取满足条件的元素的具体坐标列表时。例如，你可能需要这些坐标来进行后续的迭代、可视化标记，或者传递给其他需要坐标作为输入的函数。
布尔掩码的用途： 对于基于条件对数组元素进行选择、修改或赋值的场景，布尔掩码是NumPy中更推荐、更高效、更简洁的方法。它避免了处理复杂的坐标数组，并直接利用了NumPy的矢量化能力。
避免陷阱： 永远不要直接将np.argwhere返回的2D坐标数组作为多维数组的单一索引来期望进行元素级的精确赋值。这会导致NumPy将其解释为沿第一个维度（例如行）的选择。如果确实需要使用坐标进行赋值，可以考虑使用arr[coords[:, 0], coords[:, 1]] = value的形式（对于2D数组），但这通常不如布尔掩码直观和高效。

掌握布尔掩码是NumPy编程中的一项基本且强大的技能，它能帮助您编写出更清晰、更高效、更少出错的数组处理代码。

发表于：后端开发

近一天内

# Boolean # numpy # 切片 # 多维数组 # 布尔类型 # 运算符

复制链接

Python怎么从pandas DataFrame中选择特定的行和列_pandas数据索引与切片技巧

Google Cloud Function 异常处理与状态码返回

macOS系统下Go语言工作区（GOPATH）的创建与管理

在Django中禁用PasswordResetView的自动邮件发送功能

CentOS 7上PHP Mailparse扩展的安装与配置指南

深入理解NumPy数组索引：避免np.argwhere在多维数组赋值中的陷阱

理解NumPy中的数组索引与np.argwhere

np.argwhere的工作原理

np.argwhere输出作为索引的陷阱

正确的姿势：利用布尔掩码进行条件赋值

示例：使用布尔掩码解决阈值化问题

总结与最佳实践

如何下载php文件下载文件_获取php文件下载功能代码的方法

如何根据动态分组大小数组批量分组数组元素

JavaScript移动端适配_JavaScript响应式开发

如何使用在线沙箱环境测试HTML交互功能的详细教程

php怎么用域名_PHP域名绑定与网站访问配置方法

什么是杠杆交易？如何在Gate交易所进行杠杆交易？Gate进行杠杆交易的图文教程

Laravel怎么调用外部API_Laravel Http Client客户端使用

Sublime打造Java开发环境_集成LSP实现代码补全与语法检查

Go 结构体嵌入深度解析：理解其与传统继承的本质区别

Intro.js教程：在引导消息中集成富文本与自定义HTML元素