Ⅰ.Grid Search/Random Search
Grid Search:神经网络训练由许多超参数决定,例如网络深度、学习率、卷积核大小等等。为了找到一个最好的超参数组合,最直观的想法就是Grid Search, 其实也就是穷举搜索。
Random Search:为了提高搜索效率,提出随机搜索。虽然随机搜索得到的结果互相之间差异较大,但是实验证明随机搜索的确比网格搜索效果要好
Ⅱ.Bayesian Optimization
贝叶斯优化的大体思路:
假设一组超参数组合是 X = x 1 , x 2 , . . . , x n X = x_1,x_2, ...,x_n X=x1,x2,...,xn, 贝叶斯优化假设超参数与需要优化的损失函数存在一个函数关系。
假设函数 f : x → R , 我 们 需 要 在 x ⊂ X 内 找 到 \ f :x → R, 我们需要在 x \subset X内找到 f:x→R,我们需要在x⊂X内找到
x ∗ = a r g m i n x ∈ X f ( x ) ( 1 ) x^* =\mathop{argmin}\limits_{x \in X}f(x) \qquad (1) x∗=x∈Xargminf(x)(1)
详细算法:
Sequential model-based optimization(SMBO)
I n p u t : f , X , S , M \ {Input: f, X, S, M} Input:f,X,S,M
D ← I n i t S a m p l e s ( f , X ) D \leftarrow InitSamples(f, X) D←InitSamples(f,X)
f o r i ← ∣ D ∣ t o T d o : for \quad i \leftarrow |D| \quad to\quad T \quad do : fori←∣D∣toTdo:
p ( y ∣ x , D ) ← F i t M o d e l ( M , D ) \qquad p(y|x, D) \leftarrow FitModel(M,D) p(y∣x,D)←FitModel(M,D)
x i ← a r g m a x x ∈ X S ( x , p ( y ∣ x , D ) ) \qquad x_i \leftarrow \mathop{argmax}\limits_{x \in X}S(x, p(y|x, D)) xi←x∈XargmaxS(x,p(y∣x,D))
y i ← f ( x i ) ▹ E x p e n s i v e s t e p \qquad y_i \leftarrow f(x_i) \quad \triangleright Expensive \ step yi←f(xi)▹Expensive step
D ← D ∪ ( x i , y i ) \qquad D \leftarrow D\cup (x_i,y_i) </




796

被折叠的 条评论
为什么被折叠?



