聚类分析

聚类分析是多元数据分析方法,常用于经济学、产品质量管理、生物学和考古等领域。其基本思想是通过定义样品间的距离和变量间的相似系数来衡量相似程度,然后按相似程度归类。样品间的距离包括欧氏距离、绝对距离等多种类型,变量间的相似性常用相关系数度量。谱系聚类计算量大,适用于关系稳定的分类,Java实现已可用。
 

聚类分析

---谱科聚类分析

一、基本思想及意义

意义:聚类分析是研究分类问题的多元数据分析方法。聚类分析有极其广泛的应用背景。在经济学中,为了了解不同地区的城镇居民的收入及消费情况,往往需要划分不同的类型去研究;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品、二等品等;在生物学中,要根据各生物体的综合特征进行分类;又如在考古中,要将某些古生物化石进行科学的分类等等。

基本思想:在样品之间定义距离,在变量之间定义相似系数,距离或者相似系数代表着样品或者变量之间的相似程度。按相似程度的大小,将样品(或变量)逐一归类,关系密切的类聚集到一个小的分类单位,然后逐步扩大,使得样品关系疏远的聚合到一个大的分类单位,直到所有的样品(或者变量)都聚集完毕,形成一个表示亲疏关系的谱系图,依次按照某些要求对样品(或者变量进行分类)。

二、样品间的相似性度量——距离及变量间的相似性度量——相关系数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值