样本不平衡的数据建模——decoupling representation and classifier

本文介绍了一种名为Decoupling Representation and Classifier的方法,该方法将分类模型的特征表示和分类部分分离,分别进行训练,以提高长尾识别任务的性能。通过在多个数据集上进行实验,该方法在少样本类别上的表现优于联合训练模型。

一、简要说明

decoupling representation and classifier(解耦特征表示模块和分类模块),将原来的分类模型拆分成两部分分别进行训练。比如ResNet-50,一般有神经网络层+分类层(全连接+softmax)构成。以前的模型是对这两部分做联合估计和拟合,但是decoupling representation and classifier是将这两部分分开来估计。

二、来源

该方法来自于论文:DECOUPLING REPRESENTATION AND CLASSIFIER FOR LONG-TAILED RECOGNITION
论文网址:https://openreview.net/pdf?id=r1gRTCVFvB
论文代码:https://github.com/facebookresearch/classifier-balancing
该方法据说有The state of art的效果,但本人还没有测试。

三、数据集

论文数据集
Places-LT 、mageNet-LT 、iNaturalist 2018都是图片数据集。三个数据集有些类别的样本量特别少(如5个),而有些类别的样本量很多(如5千个)。建模目的是对图片进行分类。

四、模型架构

特征表示部分使用ResNet-50模型,分类部分作者尝试了多种形式,这些形式的一般形式是
在这里插入图片描述

1)Classifier Re-training (cRT)
先对ResNet-50和classifire部分进行训练,然后ResNet-50模型架构保持不变,利用class-balanced数据对上面的一般形式进行拟合。

2)Nearest Clas

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值