《数据挖掘》国防科技大学
《数据挖掘》青岛大学
《数据挖掘与python实践》
数据挖掘之认识数据
1. 数据和信息
**数据(data)**是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。
在计算机系统中,各种字母、数字符号的组合、语音、图形、图像等统称为数据,数据经过加工后就成为信息。
2. 数据对象及属性类型
数据集由数据对象组成,一个数据对象对应一个实体,数据对象也可以成为元组。
用于表示数据对象的特征或功能的数据字段称为属性。
属性类型:
- 标称属性 nominal:状态可列举
特殊:二进制属性,(0,1)
· 对称二进制:数量相当
· 不对称二进制:数量差距大 - 序数属性 ordinal:有意义的顺序,如大、中、小
- 区间标度属性 interval scaled:以单位长度顺序性度量,值有序,无零点,倍数无意义
- 比率标度属性 ratio scaled:具有


1万+

被折叠的 条评论
为什么被折叠?



