针对多数据源或异构数据集,采用单个核函数的聚类效果不理想的问题,以及考虑到不同属性对不同类别重要性的差异,本文提出了一种属性加权多核模糊聚类算法(WMKFCM)。该算法将多核模糊聚类算法与属性加权核模糊聚类算法相结合,不仅能够处理单个核函数不能满足待聚类数据集聚类准确度要求的问题,而且能在聚类过程中根据不同类的具体特性动态调整各个属性对于不同类别的重要性。聚类实验表明,在牺牲一定的运行时间和迭代次数的前提下,相比于属性加权核模糊聚类算法和多核模糊聚类算法,属性加权多核模糊聚类算法具有更高的聚类准确度。
聚类算法作为一种无监督学习方法,为识别数据内在结构提供了一种有用的工具,是数据挖掘的重要研究内容之一。聚类分析的一般过程是,根据数据之间的相似性将数据划分到不同的簇集,结果使得同一簇中的数据具有较高的相似度,而不同簇间的数据具有较低的相似度。1974 年,Bezdek建立了模糊聚类理论。模糊聚类分析采用隶属度函数表示样本间的亲疏程度,能够更加全面的体现数据集的结构。2002 年,Girolami 将聚类与核方法相结合,首次提出了核聚类方法,为之后的核聚类研究奠定了基础。2004 年,伍忠东,高新波等将核方法的思想推广到模糊c-均值算法,构造了基于核方法的模糊核c-均值算法。2009 年,赵犁丰,李新等人针对多类样本数据,提出一种多核模糊聚类算法。通过选取子核函数及其参数构造多核函数,使得输入空间的样本经多核映射后增大不同类别样本间的差别,提高核函数的学习能力和泛化能力。2011 年,王栋将加权多宽度高斯核学习引入到聚类分析中,提出了一种加权多宽度高斯核聚类算法。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
全部0条评论
快来发表一下你的评论吧 !