数据挖掘——认识数据

《数据挖掘》国防科技大学
《数据挖掘》青岛大学
《数据挖掘与python实践》

数据挖掘之认识数据

1. 数据和信息

**数据(data)**是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材

在计算机系统中,各种字母、数字符号的组合、语音、图形、图像等统称为数据,数据经过加工后就成为信息

2. 数据对象及属性类型

数据集由数据对象组成,一个数据对象对应一个实体,数据对象也可以成为元组
用于表示数据对象的特征或功能的数据字段称为属性
属性类型:

  1. 标称属性 nominal:状态可列举
    特殊:二进制属性,(0,1)
    · 对称二进制:数量相当
    · 不对称二进制:数量差距大
  2. 序数属性 ordinal:有意义的顺序,如大、中、小
  3. 区间标度属性 interval scaled:以单位长度顺序性度量,值有序,无零点,倍数无意义
  4. 比率标度属性 ratio scaled:具有
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值