OPTICS 是一种基于密度的聚类算法,是 DBSCAN 的扩展,能够处理不同密度的簇。
算法需要的参数:邻域半径ε,最小点数minPts。若需要提取簇,则需要参数ε',其取值≤ε。
1.核心概念定义:
1.1核心距离:对于任意点x和参数minPts,核心距离dcore(x)是x到其第minPts个最近邻的距离。若x的邻居数|Nε(x)|<minPts,则dcore(x)=∞;若|Nε(x)|≥minPts,dcore(x)值取点x的第minPts个近邻的距离值。核心距离表示点x是否为核心点,核心点能生成簇。
如数据集的坐标分别是(1,1,1),(0,0,0),(0,0.5,0),(1,1,0.5)
设置最小点数minPts为2,请找出点(1,1,1)的核心距离。则dcore((1,1,1))=1.5;
在python代码中的实现方式如下:

1.2可达距离:对于点x和其邻近点o,可达距离的计算方式为:

其中d(x,o)是点x和点o的欧式距离。可达距离表示从核心点x到点o的密度连接成本。对点o来说,它的可达距离是基于核心点x计算的,若没有前驱核心点x,则点o的可达距离为UNDEFINE(即初始值∞)。
2.算法整体实现流程图:
2.1主流程:

2.2簇扩展:
其详细实现如下图:

2.3优先队列Seeds更新:
具体步骤如下:


2442

被折叠的 条评论
为什么被折叠?



