聚类分析-层次聚类(Hierarchical Clustering)在生物信息学中的应用

层次聚类是一种聚类算法,通过计算不同类别数据点间的相似度创建聚类树。该文介绍了层次聚类的基本原理及其在生物信息学中的应用,如蛋白质序列数据聚类和基因表达数据的聚类。

聚类分析-层次聚类(Hierarchical Clustering)解析

层次聚类
层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。层次聚类可以被分为两类:自上而下和自下而上,其中常用的自下而上算法(Bottom-up algorithms),也称为hierarchical agglomerative clustering 或HAC。层次聚类常用的合并算法是通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性,距离越小,相似度越高。并将距离(层次聚类使用欧式距离来计算不同类别数据点间的距离)最近的两个数据点或类别进行组合,生成聚类树。在聚类树中,不同类别的原始数据点是树的最底层,树的顶层是一个聚类的根节点。

层次聚类(Hierarchical Clustering)在生物信息学中的应用
层次聚类是一种比较实用的聚类方法,应用于不同领域的数据分析算法中。在生物医学信息学领域,层次聚类方法常常用于蛋白质序列数据聚类和基因表达数据的聚类。结构相似的蛋白质,功能也相似,通过聚类将相似功能的蛋白质聚为一类,为研究蛋白质的功能提供帮助。基因表达数据聚类就是将具有相似表达谱的基因聚为一类,称为共表达基因,根据基因的共表达现象推断这些基因的生物学功能,从而对新的基因功能进行注释,对基因的生物学功能研究具有重要意义。

Figure1. Agglomerative hierarchical clustering of blood and brain samples. (Kong S, *et al*. 2015)在这里但是插入图片描述Figure1. Agglomerative hierarchical clustering of blood and brain samples.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

荞麦agan

您的每一次打赏,都是对我的鼓励

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值