SQL聚合函数详解_COUNT SUM AVG使用场景

8次阅读

count、sum、avg 是sql基础聚合函数,需配合group by使用且自动忽略NULL;count(*)统计所有行,count(列)统计非null行,count(distinct 列)去重计数;sum仅适用于数值列,跳过null;avg等于sum(列)/count(列),受异常值影响大,需谨慎使用。

SQL聚合函数详解_COUNT SUM AVG使用场景

COUNT、SUM、AVG 是 SQL 中最常用的基础聚合函数,分别用于计数、求和与计算平均值。它们必须配合 GROUP BY 使用(除非全表聚合),且会自动忽略 NULL 值——这是理解结果偏差的关键。

什么时候用 COUNT?注意 COUNT(*) 和 COUNT(列) 的区别

COUNT 用来统计行数,但写法不同,语义完全不同:

  • COUNT(*):统计所有行,包括含 NULL 的行,也包含重复行。适合“这张表一共有多少条记录”这类需求。
  • COUNT(列名):只统计该列非 NULL 的值的行数。比如 COUNT(email) 表示“有多少用户填了邮箱”。
  • COUNT(DISTINCT 列名):统计该列去重后的非 NULL 值数量。例如 COUNT(DISTINCT user_id) 可查有多少独立用户下单过。

SUM 适用场景:只对数值列有意义,且需警惕 NULL 和类型隐式转换

SUM 用于累加数值型字段,常见于订单金额、库存数量、积分等场景:

  • 若列中存在 NULL,SUM 会跳过它,不会报错也不会转为 0;但如果整列都是 NULL,结果返回 NULL。
  • 别对字符串或日期直接 SUM——即使数据库没报错(如 mysql 允许字符串转数字),也可能导致意外结果。例如 SUM('123abc') 在某些模式下变成 123,但 SUM('abc123') 变成 0。
  • 建议显式过滤异常值:SUM(CASE WHEN amount > 0 THEN amount ELSE 0 END),避免负数干扰业务逻辑。

AVG 要小心分母为零、NULL 和数据分布偏斜

AVG 实质是 SUM(列)/COUNT(列),所以它天然继承了前两者的特性:

  • AVG(列) = SUM(列) / COUNT(列),不是 SUM(列) / COUNT(*)。这意味着它只基于非 NULL 值计算,分母永远不会是 0(空集时返回 NULL)。
  • 当数据存在极端值(如一个订单 100 万元,其余都在 100 元以内),AVG 会被拉高,失真明显。此时可搭配 MEDIAN()(部分数据库支持)或用分位数替代。
  • 需要“带权平均”时不能直接用 AVG,得手写:SUM(单价 * 数量) / SUM(数量)

组合使用小技巧:HAVING 筛选分组结果,COALESCE 处理空值

聚合后常需进一步过滤或美化输出:

  • HAVING 替代 WHERE 对聚合结果筛选。例如查“平均订单额超 500 的城市”:
    GROUP BY city HAVING AVG(order_amount) > 500
  • 聚合结果可能为 NULL(如某类商品无销售记录),用 COALESCE(AVG(rating), 0) 统一转成 0,避免前端报错或展示为空。
  • 想同时看总数、总金额、平均单笔金额?一行搞定:
    select COUNT(*), SUM(amount), AVG(amount) FROM orders WHERE status = 'paid'
text=ZqhQzanResources