CS231n学习记录

原创已于 2022-01-26 15:37:19 修改 · 257 阅读

·

7

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#深度学习 #计算机视觉 #机器学习

于 2021-08-14 11:02:38 首次发布

嵌入式系统同时被 2 个专栏收录

350 篇文章

订阅专栏

156 篇文章

订阅专栏

本文探讨了线性代数在训练和推理中的应用，特别是向量点积与相似度的关系。针对K近邻算法的效率问题，提出通过牺牲训练速度换取更准确模型。讨论了L1和L2距离概念，以及超参数如K的选择。文章还涉及了卷积神经网络与线性分类器的联系，并强调了池化参数设置。最后，解析了网络深度、参数分布及权重归一化的考量。

1.关于训练和推理。

线性代数很重要，理解向量点积，向量点积和向量相似度正相关。

最邻近算法的缺点，训练很快，推理很慢，这不符合我们的要求，因为我们希望训练慢一点，这样可以训练出更准确的模型，而且训练是在数据中心完成的，能够承担更大的计算量。我们希望推理快一点，这样可以部署在算力比较小的终端设备上面。

2.关于距离

L1距离是正方形，正方形上每个点到原点的L1距离是相同的，L2距离是欧几里得距离，是圆形，圆形上的点到原点的L2距离也是相同的

3.超参数的概念

比如，K邻近分类中的K就是超参数。

更好的办法，轮流作validation

4.线性分类器和CNN的关系

5.卷积核是对包含整个深度的三维立体图像结构进行卷积的，所以，图像深度信息在卷积后就没有了，剩下了图像大小和卷集核的个数信息。通常，卷积核是三维的，不是二维的。一次卷积核产生一个数字。

池化，没有重叠，最大池化一般好于平均池化，选择最神经的神经元。

池化参数：

GPUs VS CPUs

通常说的网络深度，是指可训练层的个数，也就是计算层的数量，包括卷积层和全连接层。

大部分参数在FC层，大部分内存在前面的COV层。

零填充

要不要对权重进行batch normalization，看斯坦福的小姐姐是怎么说的

结束！

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

papaofdoudou 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。