【面经笔记】红云融通电话二面

最新推荐文章于 2017-08-02 18:04:47 发布

原创最新推荐文章于 2017-08-02 18:04:47 发布 · 825 阅读

0 ·

本内容遵循CC 4.0 BY-SA版权协议

深信服面试题专栏收录该内容

10 篇文章

订阅专栏

本文详细介绍了深度学习模型中的关键参数，包括学习率、网络层数、批大小、损失函数等，并给出了具体数值示例。此外，还探讨了梯度下降算法的变种Adam及其原理，以及CUDA优化措施等内容。

问到各种深度学习的参数，需要了解参数的含义及在实际工程应用中大概值如

1、lr 学习率：0.0001

2、层数：VGG本身是13卷积层+3全连接层
取VGG的前 13层卷积层+1层全连接层，后面接7层反卷积层

3、batch_size,：1，每次处理一张

4、loss 损失：20000多收敛到6000

5、损失函数：

交叉熵损失函数/logistics loss

http://blog.csdn.net/lanchunhui/article/details/50970625

sigmoid梯度

- 1 n \sum i = 0 n y ˆ i l o g (y i)

$-\frac{1}{n}\sum_{i=0}^n \widehat y_ilog(y_i)$

function [loss, delta] = loss_crossentropy_paired_sigmoid_grad(pred, output, penalty)

[h,w,c,n] = size(pred);

act = 1 ./ (1 + exp(-pred)); //sigomid

if nargin > 2,
    loss = -log(act).*output.*penalty;
    loss = sum(loss(:));
    delta = (act - output).*penalty;
else
    loss = -log(act).*output;//交叉熵
    loss = sum(loss(:));
    delta = act - output;
end