跨行业数据挖掘标准流程(CRISP-DM模型)基本步骤

本文详细解读了CRISP-DM模型,包括商业理解、数据理解、数据准备、模型建立、模型评估与实施五个关键步骤,展示了如何将商业目标转化为数据挖掘流程,以提升数据价值和商业决策效率。

CRISP-DM模型简介:
      CRISP-DM是Cross Industry Standard Process -Data Mining的缩写,是当今数据挖掘界通用的流行标准之一。它强调数据挖掘技术在商业中的应用,是用以管理并指导Data Miner 有效、准确的开展数据挖掘工作以期获得最佳挖掘成果的一系列工作步骤的标准规范。
CRISP-DM模型的基本步骤包括:

  • 商业理解:
          这一步骤旨在从商业角度理解项目的目标和需求,把理解转化为数据挖掘问题的定义和制定以实现目标为目的的初步计划。具体步骤包括:
    1、确定业务目标:
          分析项目背景,以业务视角分析项目的目标和需求,确定业务角度的成功标准;
    2、项目可行性分析:
          分析拥有的资源、条件和限制,进行风险、成本和效益的评估;
    3、确定数据挖掘目标:
          明确数据挖掘的目标和成功标准,数据挖掘目标和业务目标是不一样的,前者指的是在技术上,例如生成一颗决策树。
    4、提出项目计划:
          对整个项目做一个计划,初步确认用到的技术和工具。
  • 数据理解
          数据理解阶段开始于原始数据收集,然后是熟悉数据,表明数据质量问题,探索并初步理解数据,发觉有趣的子集以形成对隐藏信息的假设。具体步骤包括:
    1、收集原始数据:
        
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

不会飞的乌龟

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值