如何在c++中实现一个简单的函数式map和filter? (Ranges与Lambda)

10次阅读

c++20 ranges::transform 和 copy_if 分别实现 mapFilter,需预分配目标空间或用 back_inserter;filter_view 惰性但不拥有数据,易致悬垂,安全做法是分步构造中间容器。

如何在c++中实现一个简单的函数式map和filter? (Ranges与Lambda)

用 C++20 ranges::transform 实现 map

标准库ranges::transform 就是 C++ 版本的 map,它对范围中每个元素应用一个可调用对象,并将结果写入目标迭代器(或原地变换)。关键不是“造轮子”,而是正确使用它避免常见陷阱:

  • 目标容器必须预先分配空间,或用 std::back_inserter 写入动态容器(如 std::vector
  • 不能直接对 std::Array 或字面量数组原地 transform 后返回新数组——C++ 没有隐式“返回新范围”的语法糖
  • Lambda 捕获需谨慎:若传入临时对象(如字符串字面量转 std::String),捕获引用会导致悬垂
std::vector nums = {1, 2, 3, 4}; std::vector doubled; doubled.reserve(nums.size()); // 避免多次 realloc std::ranges::transform(nums, std::back_inserter(doubled), [](int x) { return x * 2; });

用 C++20 ranges::copy_if 实现 filter

ranges::copy_if 是最贴近函数式 filter 的标准做法。注意它不就地过滤(不像 pythonlist.remove()),而是把满足条件的元素拷贝到新容器——这符合纯函数语义。

  • 谓词 lambda 必须返回 bool,且不能修改输入(否则违反 const 正确性)
  • 如果源范围是 std::vector 且你只想要偶数,别用 erase-remove 习语——那不是 filter,是就地删除
  • std::string 过滤字符时,std::string::iteratorstd::string_view 的生命周期要匹配
std::vector nums = {1, 2, 3, 4, 5}; std::vector evens; evens.reserve(nums.size() / 2); std::ranges::copy_if(nums, std::back_inserter(evens), [](int x) { return x % 2 == 0; });

为什么不用 ranges::filter_view?

std::ranges::filter_view 看起来更“函数式”,但它只是个惰性适配器,返回的是一个 view(视图),不是拥有所属数据的容器。一旦源容器被销毁,view 就失效:

  • 不能直接 return 一个 filter_view 给调用方(除非确保源生命周期更长)
  • 无法用 std::size 获取长度(某些 view 不支持 O(1) size)
  • 遍历两次可能触发重复计算(比如底层是生成器或 I/O 流)
  • 调试时打印内容困难——gdb / ide 通常不友好显示 view 内容
auto evens_view = nums | std::views::filter([](int x) { return x % 2 == 0; }); // ⚠️ 下面这行危险:nums 被 move 后,evens_view 迭代失败 // return evens_view; // 不推荐

组合 map 和 filter 的安全写法

想先 filter 再 map?不要嵌套 view(易读性差、生命周期难控),优先用中间容器或管道操作符 + std::ranges::to(C++23);若限于 C++20,分两步明确构造:

立即学习C++免费学习笔记(深入)”;

  • copy_if 到临时 vector,再 transform 它——清晰、可调试、无悬垂风险
  • 避免 auto res = nums | views::filter(...) | views::transform(...) 后直接赋值给 std::vector——C++20 不支持自动转换,会编译失败
  • 若性能敏感且数据量大,考虑用 std::span 做只读切片,但 map/filter 结果仍需新存储
std::vector nums = {1, 2, 3, 4, 5, 6}; std::vector filtered; filtered.reserve(nums.size()); std::ranges::copy_if(nums, std::back_inserter(filtered), [](int x) { return x > 2; }); 

std::vector result; result.reserve(filtered.size()); std::ranges::transform(filtered, std::back_inserter(result), [](int x) { return x * x; });

真正容易被忽略的是:C++ 的 ranges 操作默认不拥有数据,也不管理内存。所谓“函数式”在 C++ 里本质是“无副作用 + 明确所有权”,而不是模仿 Haskell 的懒求值。写错一步,就是悬垂指针或未定义行为。

text=ZqhQzanResources