一、前言
相信关注我的很多小伙伴都是深度学习相关的方向,所以数据集也是必定不可少的一部分,但是数据集找起来难,特别是一些和国际前沿挂钩的计算机视觉和模式识别方向,很多时候需要下载多达几十个G的数据集,有时候是提供Google云盘的链接,有时候是去数据集作者官网下载、有时候甚至都没办法找到相关数据集的链接,所以我稍微整理了一下数据集常用的寻找方法,希望对研一入门的萌新提供一定的助力。
如果大家觉得本公众号的内容对大家有帮助,还请各位小伙伴多多分享给自己同学,让我更新更有动力!
二、常用方法
1.论文内提供
这也是最常见的方式,一般论文在Abstract部分就会提供一个Github仓库地址,当你打开之后会在Readme文件里面看到Training数据集的链接或者直接提供网盘链接,这也是最快最便捷的方式。

然后点开Github地址后可以迅速找到相关训练集和测试集信息:

直接跳转到相关页面下载即可,这里我就不多教了,不过大家可以下载一个IDM,能极大地提高下载速度。
2.去Kaggle数据集网址寻找
Kaggle是一个流行的数据科学竞赛平台,同一个问题可以有多个模型来解决,但是研究者不可能在一开始就了解哪些模型是最好的,Kaggle应运而生,大家可以在这个平台上集思广益。对于小白来说,诱惑力之一还是平台上众多的数据集。我们需要的99%的数据集都能在该平台找到答案,如果再找不到就只能依靠强大的Google了。
我们直接打开一下网址即可

本文汇总了数据集获取的常用方法,包括从论文提供的Github仓库、Kaggle数据集平台以及Google数据集搜索。详细介绍了每个渠道的使用步骤,帮助深度学习领域的研究者快速有效地找到并下载所需数据集。

4600

被折叠的 条评论
为什么被折叠?



