NLP学习笔记27-优化Optimization

本文深入探讨了机器学习中的优化问题,强调了优化算法在AI模型选择和实现过程中的核心地位。文章介绍了优化算法的分类,如线性回归、逻辑回归、SVM和协同过滤,并通过股票量化投资的例子展示了优化的重要性。接着,作者详细阐述了目标函数的分类,特别是凸函数的性质,包括凸集和凸函数的定义及判别方法。文中通过最大流问题和集合覆盖问题举例,解释了凸函数和非凸函数在实际问题中的应用。最后,讨论了如何将非凸问题转化为线性问题以寻找近似最优解。

一 序

   本文属于贪心NLP训练营学习笔记系列。视频151 变分推断先跳过。

二 为啥要关注优化

 通常有关AI的问题可以分解为:模型+优化

模型就是如何选择模型:逻辑回归、深度学习等,然后进行模型的实例化,例如选择深度学习,有几层,每层的参数等。

实例化完毕之后,我们总是可以找到一个与实例化之后的模型相对应的objective function(目标函数),接下来就进入了优化的阶段。

优化有很多算法,见截图,有了objective function之后,就是要归类,再选择合适的优化算法解决。

公式下面的,认为是条件。

Optimization is the Core of Machine Learning

线性回归(Linear Regression): minimize_w ||Xw-y||^2_F
逻辑回归(Logistic Regresssion):minimize_{w,b} =\sum^n_{i=1}y_ilog(\sigma(w^Tx_i+b)) +(1-y_i)log[1-\sigma(w^Tx_i+b)] +\lambda||w||^2_2
SVM(Support Vector Machine):||w||^2 +c\sum^n_{i=1} \epsilon_i \;\;\;\; s.t. \epsilon \geq 1-y_ix_i^Tw,\;\; \epsilon_i \geq 0
协同过滤(Collaborative Filtering):矩阵分解
K均值(K-means):minimize_{\mu_1,...,\mu_k} \sum^K_{j=1}\sum^n_{i=1} ||x_i^{(j)} - \mu_j||^2

portfolio optimization

老师以股票量化投资为例,介绍优化的重要性

三 关于objective function的分类

从下面几个维度来看:
1、是否smooth(smooth VS non-smooth):

     lasso不平滑
2、是否convex:

  是有全局最优解,否则局部最优解global optimal VS local optimal

 local optimal (深度学习) -> 初始化变得十分重要 -> multiple/better initialization

3、是否连续(discrete VD continuous):

  连续可用梯度下降法,离散需要其他方法:discrete optimization (Relaxation)
4、是否有约束:

  constrained VS non-constrained

因为日常问题主要关注的是否convex。

四 Convex Optimization: global optimal VS local optimal

因为凸函数有全局最优解,所以正确的思路是把一个non-convex转变成convex。至于优化函数选择可以很多。

判断凸函数

凸集(convex set): 假设对于任意$x,y \in C$并且任意参数, 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

bohu83

买个馒头吃

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值