认知实习----day1

最新推荐文章于 2024-04-22 21:15:39 发布

原创最新推荐文章于 2024-04-22 21:15:39 发布 · 1.3k 阅读

31 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#python

1.1 人工智能（Artificial Intelligence）：人工智能即人工智能技术，是模拟人的智能行为和思维过程的一种技术方法。它使得机器能够像人类一样感知、思考、学习和决策。也就是说，人工智能就是让机器能够像人一样具备智能的能力。

1.2 机器学习（Machine Learning）：机器学习是一种让机器能够通过数据和经验来自动学习和改进的技术。就像人学习新知识一样，机器学习也是通过不断地观察和分析数据，从中找到规律和模式，然后将这些规律应用到新的数据中。

1.2.1 如何实现机器学习

1.3 深度学习(DL, Deep Learning)：也叫深度神经网络，大脑仿生，设计一层一层的神经元模拟万事万物

1.4 三者之间的关系：机器学习是人工智能的一个分支，它是通过让机器从数据中学习和改进算法，从而使机器具备处理复杂任务的能力。深度学习是机器学习的一种方法，它通过多层神经网络模拟人脑的学习过程，实现更高级的特征提取和模式识别。因此，深度学习是机器学习的一个子集，而机器学习和深度学习又都属于人工智能的范畴。

机器学习是实现人工智能的一种途径，深度学习是机器学习的一种方法。

算法的学习方式：

• 基于规则的学习 • 基于模型的学习

二、机器学习的应用领域和发展史

2.1 机器学习的应用领域：1.计算机视觉CV：对人看到的东西进行理解

2.自然语言处理：对人交流的东西进行理解

3.数据挖掘和数据分析：也属于人工智能的范畴

2.2 人工智能发展史：

1956年人工智能元年

2012年计算机视觉深度神经网络方法研究兴起

2017年自然语言处理应用大幕拉开

2022年chatGPT的出现，引起AIGC的发展

2.3 AI发展三要素：数据、算法、算力。其中三要素相互作用，是AI发展的基石。

三、机器学习常用术语

1 .样本和数据集

2. 特征

• 特征(feature) ：一列数据一个特征，有时也被称为属性

• 样本(sample) ：一行数据就是一个样本

• 数据集dataset：多个样本组成数据集

3 .标签

• 标签/目标(label/target) ：模型要预测的那一列数据。

4 .数据集划分

• 训练集用来训练模型、测试集用来测试评估模型。

• 一般划分比例7:3 ~ 8:2

四、机器学习算法分类

4.1 有监督学习：有监督学习是通过给机器提供已标记的数据样本来训练模型，模型根据这些标记来学习预测新的未标记数据的标签或属性。这种学习方式适用于分类和回归等任务，其中分类是预测离散标签，回归是预测连续属性。

4.2 无监督学习：无监督学习则是在没有标记的数据中自动发现模式和关系，对数据进行聚类、降维或异常检测等任务。它不需要已知的输出标签，而是通过发现数据内部的结构和隐藏规律来学习。

无监督学习特点： 1. 训练数据无标签

2 根据样本间的相似性对样本集进行聚类，发现事物内部结构及相互关系

4.3 半监督学习：

工作原理：

1 .让专家标注少量数据，利用已经标记的数据（也就是带有类标签）训练出一个模型

2. 再利用该模型去套用未标记的数据

3 .通过询问领域专家分类结果与模型分类结果做对比

半监督学习方式可大幅降低标记成本

4.4 强化学习：强化学习是机器学习的一种分支，旨在让智能体通过与环境的交互来学习最优的行动策略。在强化学习中，智能体通过观察环境的状态，并根据采取的行动和获得的奖励来学习如何选择最佳的行动策略。其基本原理：通过构建四个要素：agent，环境状态，行动，奖励，agent根据环境状态进行行动获得最多的累计奖励。主要应用场景：里程碑AlphaGo围棋、各类游戏、对抗比赛、无人驾驶场景。