c# 如何进行并行编程 parallel

6次阅读

Parallel.forEach 比 foreach 快因自动并行化,但短任务反慢于线程开销;需用 interlocked、Concurrent 集合或细粒度 lock 保障共享变量安全;注意 AggregateException 需展开处理。

c# 如何进行并行编程 parallel

Parallel.ForEach 为什么比 foreach 快,但有时反而更慢?

因为 Parallel.ForEach 会自动拆分数据、分配线程、合并结果,省去手动管理 Task 的开销;但若迭代体执行时间极短(比如只做一次 i++),线程调度和同步的开销会远超计算收益。

  • 适合场景:每个迭代项耗时 ≥ 几毫秒,且无强顺序依赖(如批量文件处理、http 请求、图像像素计算)
  • 不适用场景:循环体仅含简单算术、或需严格按索引顺序写入同一数组/集合
  • 注意默认线程数受 ThreadPool 限制,高并发小任务建议用 ParallelOptions.MaxDegreeOfParallelism 控制

如何安全地在 Parallel.ForEach 中更新共享变量?

直接读写普通变量(如 int count = 0)会导致竞态——多个线程同时执行 count++ 可能只加 1 次。必须用线程安全方式:

  • Interlocked.Increment(ref count) 替代 count++(整数类计数首选)
  • 对集合操作,改用线程安全类型:如 ConcurrentBagConcurrentQueue,而非 List
  • 若逻辑复杂,用 lock(obj) 包裹临界区,但粒度要小,避免锁住整个循环体

Parallel.For 和 Parallel.ForEach 的关键参数差异

两者都支持 ParallelOptions,但循环结构不同导致行为差异明显:

  • Parallel.For(0, data.Length, i => { ... }):索引驱动,适合需要下标访问数组/列表的场景,但不能直接用 data[i] 做越界检查(i 由框架分配,可能跳变)
  • Parallel.ForEach(data, item => { ... }):元素驱动,代码更直观,但无法直接获知当前索引(除非传入 Parallel.ForEach(data.AsParallel().Select((x,i)=>new{x,i}), ...),但已脱离原生 Parallel 范畴)
  • 两者都可通过 ParallelLoopState.break() 提前退出,但 Break() 不会立即终止所有线程,后续分区仍可能执行

常见错误:AggregateException 被吞掉,实际异常没被发现

Parallel 方法内部抛出的异常会被包装成 AggregateException,若不显式处理,可能静默失败或只暴露第一个 InnerException:

try {     Parallel.ForEach(items, item =>     {         if (item == null) throw new ArgumentNullException(nameof(item));         Process(item);     }); } catch (AggregateException ex) {     // 必须遍历 InnerExceptions 才能看到所有错误     foreach (var inner in ex.InnerExceptions)     {         Console.WriteLine(inner.Message);     } }

更稳妥的做法是用 ex.Flatten().InnerExceptions 展平嵌套,并注意:只要有一个线程抛异常,整个并行操作就会中止(除非用 ParallelOptions.CancellationToken 配合手动恢复逻辑)。

别忘了,调试并行代码时,VS 的“并行”窗口比普通调用更有用;而 Thread.Sleep 在循环体里是性能毒药,它会让线程池误判负载,拖慢整体吞吐。

text=ZqhQzanResources