基于相异性邻域的改进K-means算法
作者:李汉波 魏福义 张嘉龙 刘志伟
单位:华南农业大学
K-means算法从样本集随机选取初始聚类中心导致聚类结果不稳定,且聚类性能易受奇异点影响。针对以上缺陷,文章定义基于相异度矩阵的邻域半径概念,依次选取最小邻域半径对应的样本作为初始聚类中心,直到邻域半径达到样本集的平均邻域半径;若选取的聚类中心数量不足K个,逐步缩小邻域参数探索,直到选出K个。随后给出基于实验的剔除奇异点公式,得到最终的聚类结果。实验结果表明,算法在准确度和迭代次数两方面均有所改进。
DOI:
10.19850/j.cnki.2096-4706.2021.07.017
关键词:
Array
所属期刊栏目:
计算机技术
分类号:
TP311.13
页码:
67-70