机器学习笔记

原创

已于 2024-06-29 10:58:45 修改 · 800 阅读

·

22

·

标签

#机器学习 #笔记 #人工智能

于 2024-06-29 10:55:51 首次发布

机器学习(周志华) 第一章笔记

Chaper 1 基本概念

1. 基本术语

Alt

基本术语
数据集(data set)	记录数据的集合	西瓜数据集
样本(sample)	关于一个事件或对象描述的记录
特征(feature)	反映事件或对象的事项	色泽，根蒂，敲声
样本空间(sample space)	特征张成的空间	以色泽，根蒂，敲声为坐标轴、张成的描述西瓜的三维空
标记(label)	反映样本的结果	是否为好瓜
标记空间(label space)	所有标记的集合	{好瓜，坏瓜}

2. 数学描述

Alt

$\{\boldsymbol{x_1,x_2,\cdots,x_m}\}$ ：包含 $m$ 个样本的数据集 $D$

$X\mathcal{X}$ : 样本空间,每个样本由 $d$ 个特征描述, $d$ 维样本空间 $X\mathcal{X}$

$,xid)\boldsymbol{x_i} = (\boldsymbol{x_{i1},x_{i2},\cdots,x_{id}})$ : $d$ 维样本空间的一个向量， $xi∈Xx_i \in \mathcal{X}$

$x_{ij}$ : 样本 $xi\boldsymbol{x_i}$ 在第 $j$ 个属性上的取值

$y_i$ : 样本 $x_i$ 的标记 , 不是向量只是一个值

$(xi,yi):第i个样例(\boldsymbol{x_i},y_i): 第 i个样例$

$Y\mathcal{Y}$ : 所有标记的集合， $yi∈Yy_i \in \mathcal{Y}$

二分类任务，通常令 $−1,1}\mathcal{Y} = \{-1,1\}$ 或 ${0,1\}$
多分类任务， $Y>2\mathcal{Y} >2$
回归任务， $Y=R\mathcal{Y} = \mathbb{R}$

3. 学习任务分类

Alt

根据数据是否有label，学习任务可以划分为：supervised learning, unsupervised learning
Supervised learning(label): 若预测的是离散值，为classification; 若预测的为连续值，为regression.

学习目标：建立一个从输入空间/样本空间 $X\mathcal{X}$ 到输出空间 $Y\mathcal{Y}$ 的映射 $\mathcal{X} \mapsto \mathcal{Y}$

最低0.47元/天解锁文章

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。