可参考B站人工智能课程:
【整整600集】清华大学196小时讲完的AI人工智能从入门到精通全套教程,全程干货无废话!学完变大佬!这还学不会,我退出IT圈!机器学习-深度学习-opencv_哔哩哔哩_bilibili
国内大模型大全
人工智能概述
人工智能是计算机科学的一个重要领域,旨在理解和构建智能行为。人工智能可以被划分为多个子领域或分支,包括机器学习、深度学习、自然语言处理(Natural Language Processing,NLP)、计算机视觉(Computer Vision)、知识图谱(Knowledge Graphs)、强化学习(Reinforcement Learning)、机器人学(Robotics)等。AI里面有很多概念搞不清楚,比如神经网络、深度学习和机器学习等等,这些概念十分的抽象,也比较深奥难懂,所以很难理解他们的真正含义。
AI人工智能概述
人工智能(AI)是一个庞大且复杂的领域,包含多个技术分支和研究方向,这些分支相互交叉、协同发展,共同推动着 AI 的进步。以下是 AI 领域的主要技术分支及其特点:
一、基础理论与核心技术
1. 机器学习(Machine Learning, ML)
定义:通过算法让计算机从数据中自动学习规律,解决预测或决策问题。
子领域:
监督学习(如分类、回归,用于图像识别、垃圾邮件过滤);
无监督学习(如聚类、降维,用于数据挖掘、用户分群);
强化学习(通过奖励机制训练智能体,用于游戏 AI、机器人控制);
半监督学习(结合少量标注数据和大量未标注数据)。
关键算法:决策树、支持向量机(SVM)、随机森林、神经网络等。
2. 深度学习(Deep Learning, DL)
定义:机器学习的子集,基于深层神经网络模拟人脑神经结构,处理复杂数据。
子领域:
卷积神经网络(CNN):擅长图像和视频处理(如 ResNet、YOLO);
循环神经网络(RNN):处理序列数据(如 LSTM、GRU,用于自然语言处理);
Transformer 架构:基于注意力机制,革新了 NLP(如 BERT、GPT 系列)和多模态任务。
应用:计算机视觉、自然语言处理、语音识别等。
二、感知与认知技术
3. 计算机视觉(Computer Vision, CV)
目标:让计算机 “看懂” 图像或视频。
技术方向:
图像分类、目标检测、语义分割、实例分割;
三维重建、视频理解、姿态估计、视觉跟踪;
生成对抗网络(GAN):用于图像生成、风格迁移(如 DeepFake)。
应用:自动驾驶、医学影像诊断、安防监控、AR/VR。
4. 自然语言处理(Natural Language Processing, NLP)
目标:让计算机理解、生成和处理人类语言。
子领域:
文本分类、命名实体识别、情感分析;
机器翻译、文本生成(如 ChatGPT)、对话系统(聊天机器人);
知识图谱:构建实体关系网络,支持问答和推理。
关键技术:预训练语言模型(PLM)、注意力机制、语义角色标注。
5. 语音识别与合成(Speech Recognition & Synthesis)
语音识别(ASR):将语音转换为文本(如 Siri、科大讯飞);
语音合成(TTS):将文本转换为自然语音(如 Google WaveNet);
应用:智能音箱、语音交互、无障碍服务。
这里其实就是人工智能的三大基础落地方向,即文本、音频、视频处理,和人类对文字、声音、视觉的感知相对应。
三、规划与控制技术
6. 机器人学(Robotics)
融合方向:AI + 传感器 + 机械控制,实现自主机器人。
子领域:
工业机器人(高精度重复作业);
服务机器人(家庭清洁、医疗护理);
自主移动机器人(AMR):如自动驾驶汽车、无人机导航;
人机协作机器人(Cobots):与人类共同工作的安全型机器人。
7. 强化学习(Reinforcement Learning, RL)
核心思想:智能体通过与环境交互,基于奖励信号优化行为策略。
应用:游戏 AI(AlphaGo、AlphaZero)、机器人控制、推荐系统、资源调度(如数据中心节能)。
四、跨领域与新兴方向
8. 多模态学习(Multimodal Learning)
目标:融合文本、图像、语音等多类型数据,实现更全面的理解。
技术:CLIP(图文匹配)、DALL・E(文本生成图像)、多模态大模型(如 GPT-4V)。
9. 生成式 AI(Generative AI)
定义:基于深度学习生成全新内容(如图像、文本、音频)。
技术:GAN、变分自编码器(VAE)、扩散模型(Diffusion Models,用于高质量图像生成)。
应用:艺术创作、虚拟内容生成、药物分子设计。
10. 边缘 AI 与联邦学习(Edge AI & Federated Learning)
边缘 AI:在终端设备(如手机、IoT 设备)上运行 AI 模型,降低延迟和隐私风险;
联邦学习:多机构协同训练模型,数据不出本地,保护隐私(如医疗数据合作)。
11. 可信 AI 与伦理(Trustworthy AI & Ethics)
研究方向:AI 的可解释性(XAI)、公平性、鲁棒性、隐私保护(如差分隐私);
目标:解决 AI 的偏见、安全漏洞和伦理问题(如算法歧视、深度伪造滥用)。
五、传统 AI 与符号系统
12. 符号主义 AI(Symbolic AI)
核心:基于规则和逻辑符号(如专家系统),通过预定义规则处理问题;
应用:早期的医疗诊断系统(如 MYCIN)、逻辑推理(如定理证明)。
13. 知识表示与推理(Knowledge Representation & Reasoning)
目标:用形式化方法(如逻辑、本体论)表示知识,并支持自动推理;
技术:描述逻辑、语义网、自动化推理引擎。
总结:技术分支的关联性
横向关联:例如,计算机视觉依赖深度学习模型(CNN),自然语言处理依赖 Transformer 架构,而强化学习可优化机器人控制策略。
纵向演进:从早期的符号主义(规则驱动)到连接主义(数据驱动),再到当前的多技术融合(如神经符号 AI),AI 正朝着更通用、更智能的方向发展。
理解这些分支有助于根据具体需求选择技术路径,例如:
- 图像分类 → 深度学习(CNN);
- 对话系统 → 自然语言处理(Transformer + 强化学习);
- 自动驾驶 → 多模态学习 + 强化学习 + 机器人学。
要明确一点,我们具体学习时,不是去学“人工智能”本身,因为“人工智能”本身是一个大概念,就是一个目标,那就是“让机器变得跟人类一样智能”。我们为了实现这个目标,需要先学习基础的理论,主要就是机器学习,包括深度学习等等,其实就是各种算法,更直白点就是各种对数据的处理和运算,机器有了学习能力,就是智能化的第一步,然后就需要根据具体的研究方向去深入研究对应方向的一些算法,不同的方向适合不同的处理方式,就相当于把一个人培养成不同方向的专家。
人工智能发展阶段
当前属于弱人工智能阶段。
核心知识点
圈里的是主要的知识点。
常用AI工具
Anaconda
Jupyter Notebook
基础工具包
机器学习概述
可参考大神文章:
机器学习入门基础(万字总结)(建议收藏!!!)-CSDN博客
菜鸟教程
先来看看什么是机器学习。
我们人类的学习,就是先学习各种知识,然后也可以进一步根据已有的知识去推理思考出更多的知识。
类似的,所谓机器学习,是一个很宽泛的概念,泛指机器也具有的这种学习能力,机器学习更强调机器的这种能力,而非特指某种学习的技术。
机器学习是人工智能(Artificial Intelligence)的核心领域之一,使计算机系统有能力从大量的数据中学习和抽象出知识,进而对新数据进行预测和决策。机器学习的根本原理就是是通过让机器自动从庞大的数据中学习和寻找规律的一种过程或者是模式,进而做出预测或者做出决策。这可以通过构建和训练机器学习模型来实现,模型会自动学习从输入到输出之间的映射关系。
理解和掌握机器学习的基本概念、算法原理和应用方法是进入人工智能领域的重要一步:
基本概念包括监督学习、无监督学习、半监督学习、强化学习等学习模式,以及回归、分类、聚类等常见的任务类型;
算法原理包括线性回归、逻辑回归、决策树、神经网络、深度学习(Deep Learning)等;
应用方法包括准备与处理数据、选择与构建合适的模型、训练模型与评估模型的性能,以及如何调整和优化模型以得到更好的效果。
除此之外,还需要理解模型的泛化能力,即模型在未见过的数据上的预测性能,以及如何防止过拟合和欠拟合等问题。
机器学习的流程
机器学习通过让计算机从大量数据中学习模式和规律来做出决策和预测。
- 首先,收集并准备数据,然后选择一个合适的算法来训练模型。
- 然后,模型通过不断优化参数,最小化预测错误,直到能准确地对新数据进行预测。
- 最后,模型部署到实际应用中,实时做出预测或决策,并根据新的数据进行更新。
机器学习是一个迭代过程,可能需要多次调整模型参数和特征选择,以提高模型的性能。
机器学习的工作流程可以大致分为以下几个步骤:
1. 数据收集
- 收集数据:这是机器学习项目的第一步,涉及收集相关数据。数据可以来自数据库、文件、网络或实时数据流。
- 数据类型:可以是结构化数据(如表格数据)或非结构化数据(如文本、图像、视频)。
2. 数据预处理
- 清洗数据:处理缺失值、异常值、错误和重复数据。
- 特征工程:选择有助于模型学习的最相关特征,可能包括创建新特征或转换现有特征。
- 数据标准化/归一化:调整数据的尺度,使其在同一范围内,有助于某些算法的性能。
3. 选择模型
- 确定问题类型:根据问题的性质(分类、回归、聚类等)选择合适的机器学习模型。
- 选择算法:基于问题类型和数据特性,选择一个或多个算法进行实验。
4. 训练模型
- 划分数据集:将数据分为训练集、验证集和测试集。
- 训练:使用训练集上的数据来训练模型,调整模型参数以最小化损失函数。
- 验证:使用验证集来调整模型参数,防止过拟合。
5. 评估模型
- 性能指标:使用测试集来评估模型的性能,常用的指标包括准确率、召回率、F1分数等。
- 交叉验证:一种评估模型泛化能力的技术,通过将数据分成多个子集进行训练和验证。
6. 模型优化
- 调整超参数:超参数是学习过程之前设置的参数,如学习率、树的深度等,可以通过网格搜索、随机搜索或贝叶斯优化等方法来调整。
- 特征选择:可能需要重新评估和选择特征,以提高模型性能。
7. 部署模型
- 集成到应用:将训练好的模型集成到实际应用中,如网站、移动应用或软件中。
- 监控和维护:持续监控模型的性能,并根据新数据更新模型。
8. 反馈循环
- 持续学习:机器学习模型可以设计为随着时间的推移自动从新数据中学习,以适应变化。
技术细节
- 损失函数:一个衡量模型预测与实际结果差异的函数,模型训练的目标是最小化这个函数。
- 优化算法:如梯度下降,用于找到最小化损失函数的参数值。
- 正则化:一种技术,通过添加惩罚项来防止模型过拟合。
机器学习的工作流程是迭代的,可能需要多次调整和优化以达到最佳性能。此外,随着数据的积累和算法的发展,机器学习模型可以变得更加精确和高效。
这个所谓的模型,其实可以简单理解成一个函数黑盒子,比如:i*特征值1 + j*特征值2 + k*特征值3……,最后得到一个输出。因为已经事先经过了大量的同类数据的训练,然后总结出了这类数据的特征值、以及各种特征值的比重等等规律,后续遇到同类的问题,就能进行解析和预测。
注意:机器学习不是说一台机器去学习用户的交互内容,而是研发人员训练机器,通过知识库和算法来生成一套程序,这套程序里面包含了目标数据的特征和权重等信息,整体而言就可以理解成一个函数。然后把这个函数提供给用户使用,用户输入同类信息的时候,这个函数就会根据信息的特征和规律去输出对应的内容,大部分情况下都不会偏离太多,如果确实有错误,那么研发人员收到反馈后,再次调整和优化这个函数,通过调整参数或者补充知识库等方式,进一步完善该函数……久而久之,就越来越完善了。
机器学习的应用
机器学习的应用极其广泛,深深地影响着人们的生活:
推荐系统: 例如,抖音推荐你可能感兴趣的视频,淘宝推荐你可能会购买的商品,网易云音乐推荐你喜欢的音乐。
自然语言处理(NLP): 机器学习在语音识别、机器翻译、情感分析、聊天机器人等方面的应用。例如,Google 翻译、Siri 和智能客服等。
计算机视觉: 机器学习在图像识别、物体检测、面部识别、自动驾驶等领域有广泛应用。例如,自动驾驶汽车通过摄像头和传感器识别周围的障碍物,识别行人和其他车辆。
金融分析: 机器学习在股市预测、信用评分、欺诈检测等金融领域具有重要应用。例如,银行利用机器学习检测信用卡交易中的欺诈行为。
医疗健康: 机器学习帮助医生诊断疾病、发现药物副作用、预测病情发展等。例如,IBM 的 Watson 系统帮助医生分析患者的病历数据,提供诊断和治疗建议。
游戏和娱乐: 机器学习不仅用于游戏中的智能对手,还应用于游戏设计、动态难度调整等方面。例如,AlphaGo 使用深度学习技术战胜了围棋世界冠军。
……
机器学习的类型
机器学习主要分为以下三种类型:
1. 监督学习(Supervised Learning)
定义: 监督学习是指使用带标签的数据进行训练,模型通过学习输入数据与标签之间的关系,来做出预测或分类。
应用: 分类(如垃圾邮件识别)、回归(如房价预测)。
例子: 线性回归、决策树、支持向量机(SVM)。
2. 无监督学习(Unsupervised Learning)
定义: 无监督学习使用没有标签的数据,模型试图在数据中发现潜在的结构或模式。
应用: 聚类(如客户分群)、降维(如数据可视化)。
例子: K-means 聚类、主成分分析(PCA)。
3. 强化学习(Reinforcement Learning)
定义: 强化学习通过与环境互动,智能体在试错中学习最佳策略,以最大化长期回报。每次行动后,系统会收到奖励或惩罚,来指导行为的改进。
应用: 游戏AI(如AlphaGo)、自动驾驶、机器人控制。
例子: Q-learning、深度Q网络(DQN)。
这三种机器学习类型各有其应用场景和优势,监督学习适用于有明确标签的数据,无监督学习适用于探索数据内在结构,而强化学习适用于需要通过试错来学习最优策略的场景。
半监督学习
另外,还有一种混合式的学习方法也在发展之中,比如混合监督学习和非监督学习,从而形成半监督学习
半监督学习只有少量的标记数据,完全靠这些不完全标记的数据不可能训练好一个模型,依靠大量的无监督数据来提高算法性能。因此,只有选择半监督学习来使数据的价值达到最大化,使机器学习模型能够从庞大的数据集中挖掘出其隐藏规律。经过研究人员的不懈努力和长期坚持,半监督学习的发展取得了一定的成效,提出了不少半监督学习方法,也应用到了不少实际领域当中。
半监督学习的研究仍然存在许多待解决的问题,未来的研究大门正等着大家去开启。
机器学习的未来
随着数据量的爆炸式增长和计算能力的提升,机器学习的应用将继续扩展,带来更加智能和高效的系统。例如:
强化学习: 使计算机能够在没有明确指导的情况下通过试错来解决复杂问题。例如,AlphaGo 和 Dota 2 游戏 AI 都使用了强化学习。
自监督学习: 目前的机器学习模型通常需要大量带标签的数据来进行训练,而自监督学习则能够在没有标签的数据下学习更有效的表示。
深度学习: 深度学习是机器学习中的一个分支,主要关注神经网络的应用,它已经在图像识别、自然语言处理等方面取得了突破性进展。未来,深度学习将继续推动人工智能的发展。
通过机器学习,我们能够创建更智能的系统,自动化繁琐的任务,并改善我们日常生活的各个方面。随着技术的发展,机器学习将成为未来各行业的核心驱动力之一。
机器学习的任务
在机器学习中,回归(Regression)、分类(Classification)、聚类(Clustering) 是三种最基本的任务类型,它们的目标和方法有显著区别。
以下通过对比和实例解析,帮助你快速理解三者的本质区别:
一、回归(Regression)
核心目标
预测连续数值:输出是一个具体的数值(如房价、温度、股票价格)。
数学本质:寻找输入特征与连续输出之间的函数映射关系。
典型场景
房价预测:根据房屋面积、房龄、地段等特征,预测房价(如 ¥300 万、¥500 万)。
天气预报:根据气压、湿度等预测明天的温度(如 25.5℃)。
销售预测:根据历史数据预测下月销售额(如 ¥100 万)。
常见算法
线性回归、多项式回归、随机森林回归、支持向量回归(SVR)、神经网络(如 LSTM 用于时间序列预测)。
关键指标
均方误差(MSE):预测值与真实值的平均平方差。
决定系数(R²):衡量模型解释数据变异的比例(越接近 1 越好)。
二、分类(Classification)
核心目标
预测离散类别:输出是有限个类别标签(如 “猫 / 狗”“垃圾邮件 / 正常邮件”)。
数学本质:将输入特征映射到某个类别,通常基于概率或决策边界。
典型场景
图像识别:识别图片中的物体是 “猫” 还是 “狗”。
医疗诊断:判断肿瘤是 “良性” 还是 “恶性”。
情感分析:分析评论是 “正面”“负面” 还是 “中性”。
常见算法
逻辑回归(二分类)、决策树、随机森林、支持向量机(SVM)、神经网络(如 CNN 用于图像分类)。
关键指标
准确率(Accuracy):预测正确的样本占总样本的比例。
精确率(Precision):预测为正类的样本中实际为正类的比例。
召回率(Recall):实际为正类的样本中被正确预测的比例。
三、聚类(Clustering)
核心目标
发现数据分组:将相似的数据点自动划分为 “簇”(Cluster),且无预定义的标签。
数学本质:基于数据的内在相似性(如距离、密度)进行分组。
典型场景
客户分群:将用户按消费习惯分为 “高价值客户”“普通客户”“潜在客户”。
图像分割:将图像中相似颜色或纹理的区域归为同一类(如识别天空、地面、建筑)。


圈里的是主要的知识点。 








2474

被折叠的 条评论
为什么被折叠?



