Mongodb 删除重复数据

本文详细介绍了使用MongoDB进行数据去重的方法。通过聚合管道,包括$group,$match和$addToSet等操作符,实现对特定字段的重复数据检测与删除。特别关注了如何保留一条记录,避免全部数据被误删。
14530364-c07663b524031255.png
mongo数据库.png
db.meituan_cookie_shop_data.aggregate([
    {
        $group: { _id: {shopName: '$shopName',},count: {$sum: 1},dups: {$addToSet: '$_id'}}
    },
    {
        $match: {count: {$gt: 1}}
    }
]).forEach(function(doc){
    doc.dups.shift();
    db.meituan_cookie_shop_data.remove({_id: {$in: doc.dups}});
})
14530364-532951770cb8cae0.png
Snipaste_2019-09-06_11-18-55.png

1.根据userName和age分组并统计数量,$group只会返回参与分组的字段,使用$addToSet在返回结果数组中增加_id字段
2.使用$match匹配数量大于1的数据
3.doc.dups.shift();表示从数组第一个值开始删除;作用是踢除重复数据其中一个_id,让后面的删除语句不会删除所有数据
4.使用forEach循环根据_id删除数据

凌馨儿郡主

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值