LEAF:一个联邦学习的基准数据集

本文介绍了LEAF联邦学习平台提供的6个数据集,包括FEMNIST、Shakespeare等,涵盖图像分类、语言模型和情感分析等任务,并重点讲解了使用联邦平均算法的简单实现。读者需准备好Python环境和特定依赖,如tensorflow等。
Python3.8

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

LEAF提供了几个联邦学习的数据集,及简单的联邦学习例子,使用的算法是联邦平均算法,其代码是用python写的,机器学习的框架是tensorflow,所以如果要跑上面的例子,注意需要安装的环境,里面有个requirements.txt列出了要下载的python包。其地址为

https://talwalkarlab.github.io/leaf/

目前有6个数据集,可以选择是否切分为独立同分布(iid)。
1、FEMNIST
一个图像分类的数据集,识别英文字母和数字。有3550个用户,总共805263个样本,平均每个用户226.83个样本。
2、Shakespeare
预测下一个字符的语言模型数据集,从莎士比亚的作品全集中采集而来。有1129个用户(一个用户是作品中的一个角色),总共422615个样本。
3、Twitter
在Twitter上采集的数据,用于情感分析。有660120个用户,共1600498个样本。
4、Celeba
是一个带有注释的人脸数据集,可用于图像分类任务的训练。有9343个用户,共200288个样本
5、Synthetic Dataset
分类的一个数据集,有1000个用户,共107553个样本
6、Reddit
语言模型的一个数据集,有1660820个用户,共56587343个样本,是一个大数据集。

您可能感兴趣的与本文相关的镜像

Python3.8

Python3.8

Conda
Python

Python 是一种高级、解释型、通用的编程语言,以其简洁易读的语法而闻名,适用于广泛的应用,包括Web开发、数据分析、人工智能和自动化脚本

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值