如何正确实现带记忆化的组合求和递归函数(how_sum)

8次阅读

如何正确实现带记忆化的组合求和递归函数(how_sum)

本文详解 `how_sum` 函数的记忆化优化陷阱:修复因可变默认参数导致的缓存污染问题,并确保在不同输入数组下结果正确、高效且可复用。

在解决“找出数组中若干数使其和等于目标值”的经典递归问题时,朴素实现虽逻辑清晰,但存在严重的指数级时间复杂度(如 how_sum(500, [7, 14]) 会超时)。引入记忆化(memoization)是标准优化手段,但若实现不当,反而会引发隐蔽且致命的错误——正如原代码中 memo: dict = {} 作为默认参数所导致的问题。

? 核心错误:可变默认参数引发的缓存污染

python 中,函数的默认参数在定义时仅初始化一次,而非每次调用时新建。因此:

def how_sum(target, nums, memo={})  # ❌ 危险!同一字典被所有调用共享

当多次调用 how_sum(例如 how_sum(7, [2,3]) 和 how_sum(7, [2,4])),它们共用同一个 memo 字典。前一次运行缓存的 memo[7] = [3,2,2] 会被后一次直接复用——即使 [2,4] 根本无法组成 7。这正是输出错误(如 how_sum(7, [2,4]) 返回 [3,2,2] 而非 None)的根本原因。

⚠️ 注意:原问题中声称的“正确输出”本身存在逻辑矛盾(如 how_sum(8, [2,3,5]) 实际有解 [3,5] 或 [2,2,2,2]),但缓存污染会导致它返回完全无关的旧结果,这才是真正需要修复的缺陷。

✅ 正确的记忆化实现

必须确保每次顶层调用拥有独立、干净的 memo。推荐方案:使用 None 作为默认值,在函数内初始化:

def how_sum(target: int, nums: list[int], memo: dict[int, list[int] | None] | None = None) -> list[int] | None:     # 每次顶层调用都创建新 memo;递归调用则复用传入的 memo     if memo is None:         memo = {0: []}  # base case: target==0 → 空列表      # 若已计算过,直接返回缓存结果     if target in memo:         return memo[target]      # 初始化为 None,表示尚未找到解     memo[target] = None      # 尝试每个数字     if target > 0:  # 避免无效递归(target<0 已由 base case 处理)         for num in nums:             remainder = target - num             # 递归求解余数             combination = how_sum(remainder, nums, memo)             if combination is not None:                 # 找到解:在余数解后追加当前 num                 memo[target] = combination + [num]                 break  # 找到一个解即可,无需继续      return memo[target]

✅ 完整可运行示例与验证

def main():     print(how_sum(7, [2, 3]))        # [2, 2, 3] 或 [3, 2, 2](顺序取决于遍历)     print(how_sum(7, [5, 3, 4, 7]))  # [7] 或 [4, 3](任一有效解均可)     print(how_sum(7, [2, 4]))        # None(无解)     print(how_sum(8, [2, 3, 5]))      # [3, 5] 或 [2, 2, 2, 2]     print(how_sum(500, [7, 14]))      # None(因 500 不是 7 的倍数,14 是 7 的倍数)  if __name__ == "__main__":     main()

? 关键要点总结

  • 永远避免可变对象(list, dict)作为函数默认参数,这是 Python 最经典的陷阱之一。
  • 记忆化缓存的作用域必须与问题实例一致:不同 nums 数组必须使用独立缓存
  • 初始化 memo 时预置 memo[0] = [] 可省去每次检查 target == 0 的开销。
  • 使用 break 在找到首个解后立即退出循环,符合题目“返回任意一个组合”的要求,提升效率。
  • 时间复杂度从 O(n^target) 降至 O(target × n),空间复杂度 O(target)(缓存大小 + 递归)。

通过以上修正,how_sum 不仅能正确处理边界情况与无解场景,更具备工业级的健壮性与可复用性。

text=ZqhQzanResources