目录:
1.人工智能三大概念
人工智能(AI)、机器学习(ML)和深度学习(DL)
2.机器学习的应用领域和发展史
3.机器学习常用术语
样本、特征、标签、训练集和测试集
4.机器学习算法分类
有监督学习、无监督学习、半监督、强化学习
5.机器学习建模流程
一、人工智能三大概念
1.1 人工智能(Artificial Intelligence):人工智能即人工智能技术,是模拟人的智能行为和思维过程的一种技术方法。它使得机器能够像人类一样感知、思考、学习和决策。也就是说,人工智能就是让机器能够像人一样具备智能的能力。
1.2 机器学习(Machine Learning):机器学习是一种让机器能够通过数据和经验来自动学习和改进的技术。就像人学习新知识一样,机器学习也是通过不断地观察和分析数据,从中找到规律和模式,然后将这些规律应用到新的数据中。
1.2.1 如何实现机器学习

1.3 深度学习(DL, Deep Learning):也叫深度神经网络,大脑仿生,设计一层一层的神经元模拟万事万物
1.4 三者之间的关系:机器学习是人工智能的一个分支,它是通过让机器从数据中学习和改进算法,从而使机器具备处理复杂任务的能力。深度学习是机器学习的一种方法,它通过多层神经网络模拟人脑的学习过程,实现更高级的特征提取和模式识别。因此,深度学习是机器学习的一个子集,而机器学习和深度学习又都属于人工智能的范畴。
机器学习是实现人工智能的一种途径 ,深度学习是机器学习的一种方法。
算法的学习方式:
• 基于规则的学习 • 基于模型的学习
二、机器学习的应用领域和发展史
2.1 机器学习的应用领域:1.计算机视觉CV:对人看到的东西进行理解
2.自然语言处理:对人交流的东西进行理解
3.数据挖掘和数据分析:也属于人工智能的范畴
2.2 人工智能发展史:
1956年人工智能元年
2012年计算机视觉深度神经网络方法研究兴起
2017年自然语言处理应用大幕拉开
2022年chatGPT的出现,引起AIGC的发展

三、机器学习常用术语
1 .样本和数据集
2. 特征
• 特征(feature) :一列数据一个特征,有时也被称为属性
• 样本(sample) :一行数据就是一个样本
• 数据集dataset:多个样本组成数据集
3 .标签
• 标签/目标(label/target) :模型要预测的那一列数据。
4 .数据集划分
• 训练集用来训练模型、测试集用来测试评估模型 。
• 一般划分比例7:3 ~ 8:2
四、机器学习算法分类
4.1 有监督学习:有监督学习是通过给机器提供已标记的数据样本来训练模型,模型根据这些标记来学习预测新的未标记数据的标签或属性。这种学习方式适用于分类和回归等任务,其中分类是预测离散标签,回归是预测连续属性。
4.2 无监督学习:无监督学习则是在没有标记的数据中自动发现模式和关系,对数据进行聚类、降维或异常检测等任务。它不需要已知的输出标签,而是通过发现数据内部的结构和隐藏规律来学习。
无监督学习特点: 1. 训练数据无标签2 根据样本间的相似性对样本集进行聚类,发现事物内部结构及相互关系
4.3 半监督学习:

半监督学习方式可大幅降低标记成本
4.4 强化学习:强化学习是机器学习的一种分支,旨在让智能体通过与环境的交互来学习最优的行动策略。在强化学习中,智能体通过观察环境的状态,并根据采取的行动和获得的奖励来学习如何选择最佳的行动策略。其基本原理:通过构建四个要素:agent,环境状态,行动,奖励,agent根据环境状态进行行动获得最多的累计奖励。主要应用场景:里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景。
五、机器学习建模流程

在整个建模流程中,数据基本处理、特征工程一般是耗时、耗精力最多的。
机器学习建模的一般步骤:
1. 数据收集和预处理:收集与问题相关的数据,并进行数据预处理,包括数据清洗、缺失值处理、特征选择和特征转换等。
2. 特征工程:根据问题的特点和数据的情况,对特征进行进一步处理和转换,如特征缩放、标准化、离散化等,以提取更有信息量的特征。
3. 数据划分:将数据集划分为训练集和测试集。训练集用于模型的训练和参数调优,测试集用于评估模型的性能。
4. 模型选择和训练:选择适合问题的机器学习算法,并使用训练集来训练模型。训练过程涉及到确定模型的超参数和优化目标,以使模型能够最好地拟合训练数据。
5. 模型评估:使用测试集来评估模型的性能,并进行模型的调整和改进。常见的评估指标包括准确率、精确率、召回率、F1值等。
6. 模型应用和部署:根据实际需求,将训练好的模型应用到实际场景中,并进行部署和集成。
7. 模型监控和维护:对部署的模型进行监控,追踪模型的性能和表现,及时进行维护和优化。
注:这些步骤并不是严格线性的,有时需要多次迭代和调整,以获得最好的模型性能。而且,每个步骤的具体方法和工具也会根据问题的不同而有所差异。

2101

被折叠的 条评论
为什么被折叠?



