SQL去除重复项：distinct和group by使用及区别

原创于 2026-04-11 00:38:58 发布 · 387 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#sql #数据库

（注：distinct adj.不同的; 清楚的，明显的; 确切的）

DISTINCT 是最简单的方式，用于查询特定列中唯一的值。

示例：name表中有一列user_name包含重复数据，可以使用以下查询：

select distinct user_name from name;

GROUP BY 根据指定列对数据分组，每组只保留一条记录。

示例：name表中有一列user_name包含重复数据，可以使用以下查询：

select user_name from name
group by user_name;

1）必须放在查询列名字段最前面，不能放中间 / 后面

-- 正确
SELECT DISTINCT user_name, age FROM name;

-- 错误
SELECT user_name, DISTINCT age FROM user;

2）distinct 对后面所有的字段均起作用，即去重是查询的所有字段完全重复的数据，而不是只对 distinct 后面连接的单个字段重复的数据。

3）无法只对单个字段生效。若你查多列，想只按某一列去重，distinct 做不到。

一般与聚类函数使用（如count()/sum()/avg/max/min等），也可单独使用(效果 = 按全部字段整体去重）。

--代码：
SELECT 
  city, 
  COUNT(*) AS 人数, 
  AVG(salary) AS 平均工资 
FROM user 
GROUP BY city;

/*运行结果：
北京  2   7500
上海  1   9000
*/

group by 也对后面连接的所有字段均起作用，即去重是查询的所有字段完全重复的数据，而不是只对 group by后面连接的单个字段重复的数据

查询的字段与group by 后面分组的字段没有限制。（在oracle中使用group by时，查询的字段必须是group by 分组的字段和聚类函数。如select name,sex from tb_students group by name这个sql）