自助法: 给定包含m个样本的数据集D DD,我们对它进行采样产生数据集D′ D'D ′ :每次随机从D DD中挑选一个样本,将其复制到D′ D'D ′ 中,然后再将其样本放回原始数据集D DD中,使得该样本在下次采样的时候也可能被采到;这个过程重复执行m次,我们就得到了包含m个样本的数据集D′ D'D ′ 。简而言之,就是从数据集D DD中,有放回随机采样m次,组成一个新样本集D′ D'D ′ 。
import numpy as np
x= np.random.randint(-10,10,10)
y=(x>0).astype(int)
bootstrapping=[]
for i in range(len(x)):
bootstrapping.append(np.floor(np.random.random()*len(x)))
x_1=[]
y_1=[]
for i in range(len(x)):
x_1.append(x[int(bootstrapping[i])])
y_1.append(y[int(bootstrapping[i])])
print(x_1)
print(y_1)
结果:


自助法是一种统计学上的有放回抽样技术,用于从有限的数据集中创建多个副本。在给定的数据集DDD中,通过随机选择并放回的方式,重复m次以形成一个新的样本集D',每个样本在新集合中出现的次数可能不同。这种方法常用于估计统计量的方差、构建置信区间和进行模型验证。上述代码展示了如何用Python实现自助法,生成与原始数据集大小相同的样本子集。

2648

被折叠的 条评论
为什么被折叠?



