DISTINCT用于去除查询重复行,返回唯一数据,语法为select DISTINCT column_name FROM table_name;2. 可对单列或多列组合去重,多列时需所有列值相同才视为重复;3. 可与WHERE结合先过滤后去重;4. 使用时注意性能,大表应建立索引,NULL值仅保留一个,复杂去重建议用GROUP BY。

在mysql中使用DISTINCT可以有效去除查询结果中的重复行,只返回唯一的数据记录。它通常用于需要对某一列或多列进行去重的场景,比如统计不同用户、不同地区或组合字段的唯一值。
DISTINCT基本语法
DISTINCT关键字放在SELECT之后,用于指定要去重的列:
SELECT DISTINCT column_name FROM table_name;
例如,有一个用户表user_info,其中city字段有重复数据,只想查看所有不同的城市:
SELECT DISTINCT city FROM user_info;
这样返回的结果中每个城市只出现一次。
对多列进行去重
DISTINCT也可以作用于多个列,表示“组合去重”。只有当所有指定列的值都相同时,才视为重复:
SELECT DISTINCT column1, column2 FROM table_name;
比如查询不同城市的用户姓名组合:
SELECT DISTINCT city, name FROM user_info;
即使两个用户同名,只要所在城市不同,也会被当作两条独立记录保留。
结合WHERE条件使用
DISTINCT可以和WHERE一起使用,在过滤数据后再去重:
SELECT DISTINCT status FROM orders WHERE user_id = 1001;
这条语句查找用户ID为1001的所有订单状态,并去除重复状态值。
注意事项与性能建议
DISTINCT操作会触发排序或哈希处理,数据量大时可能影响性能:
- 尽量避免在大表上对大量数据使用DISTINCT
- 为涉及去重的列建立索引可提升效率
- DISTINCT不能去除NULL值之间的重复(但多个NULL会被视为相同并只保留一个)
- 如果需要更复杂的去重逻辑(如保留某条完整记录),应考虑使用GROUP BY配合聚合函数
基本上就这些。DISTINCT是简单高效的去重方式,适用于大多数单一或组合字段的唯一值提取需求。掌握其用法能帮助你快速清理冗余数据,提升查询结果的清晰度。