SQL如何查找只购买过一种商品的用户_HAVING COUNT(DISTINCT)

2次阅读

查只买过一种商品的用户需用 HAVING count(DISTINCT product_id) = 1，因 COUNT(product_id) 统计次数而非种类数，易误包含复购同一商品的用户；GROUP BY user_id 是前提，DISTINCT 必须置于 COUNT() 内。

直接用 COUNT(product_id) 会漏掉重复下单同一商品的用户——比如用户A买了5次iphone，COUNT 算出来是5，但实际只买过1种。必须用 COUNT(DISTINCT product_id) 才能统计“种类数”。

常见错误现象：HAVING COUNT(product_id) = 1 返回结果明显偏多，且包含大量高频复购同一商品的用户。

有人想绕开 GROUP BY，用 COUNT(DISTINCT product_id) OVER (PARTITION BY user_id) 算出每个用户的商品种类数，再外层过滤。可行，但多此一举：

窗口函数会扫描全表再计算，比带 GROUP BY 的聚合查询更慢，尤其数据量大时
逻辑变复杂：需嵌套子查询或 CTE，可读性下降
如果只要用户ID，GROUP BY + HAVING 一行 SELECT user_id FROM orders GROUP BY user_id HAVING COUNT(DISTINCT product_id) = 1 最直白

COUNT(DISTINCT product_id) 默认忽略 NULL 值——如果某订单 product_id 是 NULL，它不参与计数，也不导致整行被排除。这容易引发误判：

用户所有订单的 product_id 全是 NULL，COUNT(DISTINCT product_id) 结果为 0，不会被 = 1 匹配到，这是对的
但若混有有效值和 NULL（如1个iPhone + 2个NULL），COUNT(DISTINCT) 仍算作1，用户会被错误纳入结果
稳妥做法是加过滤：WHERE product_id IS NOT NULL，或用 COUNT(DISTINCT COALESCE(product_id, '')) 显式把 NULL 当作一类（但通常不推荐——NULL 本就不该算作一种商品）

语法上三者都支持 COUNT(DISTINCT column)，但行为微差：

PostgreSQL 对 TEXT 字段去重完全正常；SQL Server 要求 product_id 是可比较类型（比如不能是 XML 或 IMAGE）
SQL Server 2016+ 支持，但老版本（如2008R2）不支持 DISTINCT 在聚合中，得用子查询模拟：HAVING COUNT(*) = (SELECT COUNT(DISTINCT product_id) FROM orders o2 WHERE o2.user_id = orders.user_id)
如果 product_id 是字符串且含前后空格，'abc ' 和 'abc' 被视为不同——建议清洗数据或用 TRIM() 包裹

实际用的时候，最常被忽略的是 NULL 干扰和旧数据库版本限制，尤其是交接别人留下的 SQL Server 2008 环境，一跑就报错。

发表于：数据库

近一天内

复制链接

PHP 中使用 Transliterator 实现带重音字符的稳定多维数组排序

composer怎么查看过期依赖_composer怎么检查哪些包该升级【总结】