机器学习解决方案的通用步骤
1. 机器学习概述
机器学习本质上是智能软件,但并非电影、文学作品以及销售/营销部门所描绘的神奇魔杖,也不是能从商店货架上拿回家直接使用的实体黑盒。在现实世界中,不能简单地“将数据加载到机器中”就指望机器自动处理。机器学习有多种方法(大多源自统计学),如回归、分类和聚类,以及一系列具体的训练算法。选择使用哪种方法既需要经验和专业知识,也需要了解数据以及实际业务领域的运作方式。目前,机器学习自动化工具正在兴起,例如 Google Cloud AutoML 和 Visual Studio ML.NET Model Builder。
2. 机器学习解决方案的流程
任何机器学习解决方案都是一个包含多个复杂步骤的流程,从数据采集和准备,到模型训练、评估,再到实际部署,是一个全栈过程,需要不同的技能,更需要明确的业务愿景。其主要阶段包括:数据收集、数据准备、模型选择、模型训练、结果评估,当系统性能达到可接受水平时,进行生产部署。
2.1 数据收集
数据收集是机器学习的首要且关键步骤,它涉及数据探索和分析,反映了公司的数据文化水平。
- 数据驱动文化
- 自有数据的重要性 :若要为公司构建人工智能解决方案,必须拥有自有数据,否则无法运行有效的 AI 解决方案。
- 概念验证的局限性 :一些高管常因营销信息的吸引而开展概念验证(PoC)项目,但缺乏数据会导致 PoC 仅具指示性,无法满足实际需求。机器学习所需的数据远不止业务运营数据,还可能涉及天气预测、日程安排、交通信息等。 <
超级会员免费看
订阅专栏 解锁全文

3226

被折叠的 条评论
为什么被折叠?



