下面分享和记录一些常用的机器学习数据集:
Kaggle:爱竞赛的盆友们应该很熟悉了,Kaggle上有各种有趣的数据集,拉面评级、篮球数据、甚至西雅图的宠物许可证。
https://www.kaggle.com/
UCI机器学习库:最古老的数据集源之一,是寻找有趣数据集的第一站。虽然数据集是用户贡献的,因此具有不同的清洁度,但绝大多数都是干净的,可以直接从UCI机器学习库下载,无需注册。
http://mlr.cs.umass.edu/ml/
VisualData:分好类的计算机视觉数据集,可以搜索~
https://www.visualdata.io/
机器学习数据集
图片
植保数据集:病虫草害高清图片约80万幅,涵盖病害约1800种,农业昆虫约1200种,杂草约500种;农业病害、农业昆虫图像数据集各1个,涵盖病虫害600类,样本数量近50万个。(需要的给博主留言)
http://bcch.ahnw.cn/
www.ipmphoto.com
Labelme:带注释的大型图像数据集。
http://labelme.csail.mit.edu/Release3.0/browserTools/php/dataset.php
ImageNet:大家熟悉的ImageNet,女神李飞飞参与创建,同名比赛影响整个计算机视觉界。
http://image-net.org/
LSUN:场景理解与许多辅助任务(房间布局估计,显着性预测等)
http://lsun.cs


3647

被折叠的 条评论
为什么被折叠?



