文章目录
论文:prototypical networks for few-shot learning
地址:https://arxiv.org/abs/1703.05175v2
code:https://github.com/jakesnell/prototypical-networks
摘要
针对小样本分类任务,作者提出了一种原型网络,分类器对于在训练集中未出现的新类别必须具有足够好的泛化性,每个新类仅有少量数据。原型网络学习的是度量空间,通过计算与梅格雷的原型表示的距离来进行分类。与当时的小样本学习的方法相比,原型网络反映了一种更简单的归纳偏置,在数据有限的情况下往往会取得很好的效果。论文中的分析表明,一些简单的设计决策,可以对涉及复杂结构选择和元学习(meta-learning)产生实质性的改进。论文进一步将原型网络扩展到zero-learning,在CUB数据集上取得了sota的效果。
引言
论文中要解决的就是小样本学习中由于数据量较少而导致的过拟合问题。论文中提出的原型网络就是使用神经网络将输入映射到一个度量空间,用类原型( c k c_k ck)来表示support set中的每一类。在分类任务中,将需要分类的数据映射到度量空间为 x x x,然后与类原型 c k c_k ck比较距离,与那个近就属于那一类。如下图所示。

Prototypical network
Notaion
support set中共有N个带有标签的数据。 S = { ( x 1 , y 1 ) , … , ( x N , y N ) } S = \{(\mathbf{x}_1,y_1),\dots,(\mathbf{x}_N,y_N)\} S={ (x1,y1</

论文介绍了原型网络,一种解决小样本分类任务的方法,通过学习度量空间中的类原型进行分类。在Omniglot和miniImageNet数据集上的实验表明,原型网络在小样本学习中有出色表现,并能扩展到零样本学习。

2513

被折叠的 条评论
为什么被折叠?



