数据聚类与分类器加权方法的创新研究
在数据处理和分析领域,聚类和分类是两项重要的任务。聚类算法能够将数据集中相似的数据点划分到同一组中,而分类器则用于确定给定数据点所属的类别。本文将介绍两种创新的方法:SDCC聚类算法和基于局部类内准确率的分类器加权方法。
1. SDCC:稳定的双质心聚类技术
1.1 SDCC算法步骤
SDCC算法是一种用于数据挖掘的新聚类算法,其核心步骤如下:
1. 循环聚类 :通过while循环重复以下过程,直到聚类的数量达到期望的大小。
2. 获取质心 :从双聚类集合(DoubleClusterSet)中获取所有质心,并返回至质心集合(CentroidSet)。
3. 识别最近质心对 :在质心集合中找出距离最短的一对质心。
4. 合并聚类 :将属于这对质心的所有对象合并为一个新的聚类。
1.2 性能研究
为了评估SDCC算法的性能,研究人员在一台配备4GB RAM、Intel 2.4GHz CPU的笔记本电脑上,运行基于Java的程序。使用了四个合成的二维数据集进行简单可视化,并与K - means、GKA和KGA算法进行比较。评估指标包括聚类正确率(CCR)和稳定率(SR)。
| 算法 | 项目 | 数据集 - 1 | 数据集 - 2 | 数据集 - 3 |
|---|
超级会员免费看
订阅专栏 解锁全文

151

被折叠的 条评论
为什么被折叠?



