一 序
本文属于贪心NLP训练营学习笔记系列。视频151 变分推断先跳过。
二 为啥要关注优化
通常有关AI的问题可以分解为:模型+优化
模型就是如何选择模型:逻辑回归、深度学习等,然后进行模型的实例化,例如选择深度学习,有几层,每层的参数等。
实例化完毕之后,我们总是可以找到一个与实例化之后的模型相对应的objective function(目标函数),接下来就进入了优化的阶段。
优化有很多算法,见截图,有了objective function之后,就是要归类,再选择合适的优化算法解决。

公式下面的,认为是条件。
Optimization is the Core of Machine Learning
线性回归(Linear Regression):
逻辑回归(Logistic Regresssion):
SVM(Support Vector Machine):
协同过滤(Collaborative Filtering):矩阵分解
K均值(K-means):

portfolio optimization
老师以股票量化投资为例,介绍优化的重要性

三 关于objective function的分类
从下面几个维度来看:
1、是否smooth(smooth VS non-smooth):
lasso不平滑
2、是否convex:
是有全局最优解,否则局部最优解global optimal VS local optimal
local optimal (深度学习) -> 初始化变得十分重要 -> multiple/better initialization
3、是否连续(discrete VD continuous):
连续可用梯度下降法,离散需要其他方法:discrete optimization (Relaxation)
4、是否有约束:
constrained VS non-constrained
因为日常问题主要关注的是否convex。
四 Convex Optimization: global optimal VS local optimal
因为凸函数有全局最优解,所以正确的思路是把一个non-convex转变成convex。至于优化函数选择可以很多。

判断凸函数
凸集(convex set): 假设对于任意并且任意参数,

本文深入探讨了机器学习中的优化问题,强调了优化算法在AI模型选择和实现过程中的核心地位。文章介绍了优化算法的分类,如线性回归、逻辑回归、SVM和协同过滤,并通过股票量化投资的例子展示了优化的重要性。接着,作者详细阐述了目标函数的分类,特别是凸函数的性质,包括凸集和凸函数的定义及判别方法。文中通过最大流问题和集合覆盖问题举例,解释了凸函数和非凸函数在实际问题中的应用。最后,讨论了如何将非凸问题转化为线性问题以寻找近似最优解。

2万+

被折叠的 条评论
为什么被折叠?



