我们在使用postgresql数据库的时候,如果一张数据表在未做任何约束的情况下,很可能会出现几条完全一样的数据,即重复数据。如下图所示:

那么如果我们要删除其中的2条该怎么办呢?第一种我们可以清空表的内容,再使用INSERT INTO语句再将内容插入到表中。此方法可行,但对于专业人士来讲,并不推荐
第二种我们可以结合pg数据库中的ctid(和物理存储有关,指的是一条记录位于哪个数据块的哪个位移上面)来进行删除。这里我们使用依然先使用SELECT语句进行查询。

这样我们就可以使用唯一标识的ctid对重复数据进行删除操作,使用以下两种方式都可以删除tb_5201351表中2条数据。
DELETE FROM tb_5201351 WHERE ctid in ('(0,2)','(0,3)');
上面的方法原理是我们依次手工输入要删除指定ctid对应的数据,如果数据较多的话,我们还可以使用如下语句进行删除。
DELETE FROM tb_5201351 WHERE ctid not in (select min(ctid) from tb_5201351);
执行后的结果如下图所示:

博客介绍了PostgreSQL数据库中处理重复数据的问题。在数据表无约束时易出现重复数据,文中给出两种删除重复数据的方法,一是清空表再插入内容,但不被专业人士推荐;二是结合pg数据库的ctid进行删除,还给出了不同场景下的删除语句。
1488

被折叠的 条评论
为什么被折叠?



