- 3 次围观
具有噪声的基于密度的空间聚类(Density-based spatial clustering of applications with noise, DBSCAN)能够发现不同密度和大小的类簇,对噪声也有很好的鲁棒性,被广泛地应用到数据挖掘的任务中。DBSCAN通常需要调整参数MinPts和Eps以达到更优的聚类效果,但往往在搜索最优参数的过程中会影响DBSCAN的性能。本文从两个方面优化DBSCAN,一方面,提出一种无参的方法优化DBSCAN全局参数选择。无参方法利用自然最近邻获得数据集的自然特征值,并将自然特征值作为参数MinPts值。然后,根据自然特征值计算自然特征集合,利用自然特征集合中的数据分布特性,分别采取统计最小值、平均值和最大值3种方式得到Eps值。另一方面,采用集成数据科学实时加速平台(Real-time acceleration platform for integrated data science,RAPIDS)的图形处理器(Graphics processing unit,GPU)计算加快DBSCAN算法的收敛速度。实验结果表明,本文提出的方法在优化DBSCAN参数选择的同时,取得了与密度峰值聚类(Density peaks clustering, DPC)相当的聚类结果。
来源出处
基于RAPIDS的无参DBSCAN算法
http://sjcj.nuaa.edu.cn/sjcjycl/article/abstract/202302017
相关内容
发布日期
01/22/2024 - 00:46
发布日期
11/17/2024 - 19:48
发布日期
08/04/2020 - 01:35
发布日期
09/02/2024 - 19:26
发布日期
08/04/2020 - 01:35
发布日期
11/13/2024 - 19:47
发布日期
06/17/2022 - 10:21
发布日期
10/31/2021 - 01:47
发布日期
01/10/2022 - 19:31
发布日期
10/13/2024 - 19:35
发布日期
05/06/2024 - 09:39
发布日期
08/04/2020 - 01:35
发布日期
10/09/2024 - 19:31
发布日期
11/22/2023 - 00:25
发布日期
06/23/2024 - 17:52
发布日期
07/27/2023 - 21:49
发布日期
10/31/2021 - 01:48
发布日期
02/17/2024 - 13:54
发布日期
10/31/2021 - 01:12
发布日期
06/17/2022 - 10:21