oracle重复数据保留需要的一条数据

最新推荐文章于 2026-05-22 06:01:36 发布

原创最新推荐文章于 2026-05-22 06:01:36 发布 · 3.6k 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#经验分享 #数据库 #oracle

文章讲述了在数据库存在重复数据的情况下，如何通过设置删除标识来保留每组数据中的一个最小ROWNUM项。首先，通过HAVINGCOUNT(字段)>1找出重复数据，然后不直接删除，而是更新其他ROWNUM非最小的数据为删除标识。在操作中注意了ROWNUM与ROWID的区别，并提供了一段复杂的SQL更新语句来实现这一过程。

由于功能开发进度的问题，人员录入的时候仅能够多次录入，不能够录入之后直接以该数据未蓝本引入导致多部门的时候必须多次创建冗余的数据，且由于数据录入的不规范，录入了许多相同的数据，特别是同单位同部门的数据，故需要处理此类数据，因此需要对此类重复的数据设置删除标识，此组数据仅保留一项(可直接拉倒最底下看参看链接,自己实现)

思路

使用having count（字段）>1 获取到重复字段，然后反过来查出所有涉及到数据

由于前面已经对重复数据设置了唯一新增标识，其余的重复数据设置了引用标识，此时考虑到使用这个标识进行排序，然后得到每一组的最小一项ROWNUM，若直接进行删除重复项会导致唯一新增标识被错误的去掉了（回想一下可以先对此种数据先进行处理再设置唯一新增标识😅）

得到最小项的ROWNUM,然后对非此ROWNNUM的数据设置删除标识

代码实现

注意点:将伪列ROWNUM 给定一个别名原先尝试使用not in 发现无法实现所以只能一层层包下去

update  表1  set   字段5 = '3' where 字段4 in (
select 字段4 from (
select ROWNUM a ,x.字段4 from (
select  字段4 from 表1 t  
where  EXISTS(
select  字段1,字段2  from (
select  字段1,字段2 from  表1  where  字段5 = '0'
GROUP BY 字段1 ,字段2,字段3 HAVING count(字段2)>1 
ORDER BY 字段1
)
where  t.字段1 = 字段1 and t.字段2 = 字段2
)
ORDER BY 字段1,字段3,字段2,字段6
) x 
) b
where  
 a not  in  (
select MIN(ROWNUM) a from (
select  字段1,字段2,字段3 from 表1 t  
where  EXISTS(
select  字段1,字段2  from (
select  字段1,字段2 from  表1  where  字段5 = '0'
GROUP BY 字段1 ,字段2,字段3 HAVING count(字段2)>1  
ORDER BY 字段1
)
where  t.字段1 = 字段1 and t.字段2 = 字段2
)
ORDER BY 字段1,字段3,字段2,字段6
) x 
GROUP BY 字段1,字段2,字段3
)
);