超参数优化之贝叶斯优化(Bayesian Optimization)

Ⅰ.Grid Search/Random Search

Grid Search:神经网络训练由许多超参数决定,例如网络深度、学习率、卷积核大小等等。为了找到一个最好的超参数组合,最直观的想法就是Grid Search, 其实也就是穷举搜索。
Grid Search

Random Search:为了提高搜索效率,提出随机搜索。虽然随机搜索得到的结果互相之间差异较大,但是实验证明随机搜索的确比网格搜索效果要好
Random Search

Ⅱ.Bayesian Optimization

贝叶斯优化的大体思路:

假设一组超参数组合是 X = x 1 , x 2 , . . . , x n X = x_1,x_2, ...,x_n X=x1,x2,...,xn, 贝叶斯优化假设超参数与需要优化的损失函数存在一个函数关系。

假设函数   f : x → R , 我 们 需 要 在 x ⊂ X 内 找 到 \ f :x → R, 我们需要在 x \subset X内找到  fxRxX
x ∗ = a r g m i n x ∈ X f ( x ) ( 1 ) x^* =\mathop{argmin}\limits_{x \in X}f(x) \qquad (1) x=xXargminf(x)1
详细算法:
Sequential model-based optimization(SMBO)
  I n p u t : f , X , S , M \ {Input: f, X, S, M}  Input:f,X,S,M
D ← I n i t S a m p l e s ( f , X ) D \leftarrow InitSamples(f, X) DInitSamples(f,X)
f o r i ← ∣ D ∣ t o T d o : for \quad i \leftarrow |D| \quad to\quad T \quad do : foriDtoTdo:
p ( y ∣ x , D ) ← F i t M o d e l ( M , D ) \qquad p(y|x, D) \leftarrow FitModel(M,D) p(yx,D)FitModel(M,D)
x i ← a r g m a x x ∈ X S ( x , p ( y ∣ x , D ) ) \qquad x_i \leftarrow \mathop{argmax}\limits_{x \in X}S(x, p(y|x, D)) xixXargmaxS(x,p(yx,D))
y i ← f ( x i ) ▹ E x p e n s i v e   s t e p \qquad y_i \leftarrow f(x_i) \quad \triangleright Expensive \ step yif(xi)Expensive step
D ← D ∪ ( x i , y i ) \qquad D \leftarrow D\cup (x_i,y_i) </

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值