衡水建网站多少钱,网络管理系统中故障管理的目标是,网站开发系统计划书,客套企业名录搜索本节及后续章节将介绍深度学习中的几种聚类算法#xff0c;所选方法都在Sklearn库中聚类模块有具体实现。本节为上篇#xff0c;将介绍几种相对基础的聚类算法#xff0c;包括K-均值算法和均值漂移算法。
目录
X.1 聚类概述
X.1.1 聚类的种类
X.1.2 Sklearn聚类子模块 …本节及后续章节将介绍深度学习中的几种聚类算法所选方法都在Sklearn库中聚类模块有具体实现。本节为上篇将介绍几种相对基础的聚类算法包括K-均值算法和均值漂移算法。
目录
X.1 聚类概述
X.1.1 聚类的种类
X.1.2 Sklearn聚类子模块
X.2 K均值聚类 X.1 聚类概述
聚类Clustering是机器学习中的一类无监督学习方法。它是按照某个特定标准如距离把一个数据集分割成不同的类或簇使得同一个簇内的数据对象的相似性尽可能大同时不在同一个簇中的数据对象的差异性也尽可能地大。也即聚类后同一类的数据尽可能聚集到一起不同类数据尽量分离。
X.1.1 聚类的种类
按照策略不同传统的聚类方法主要可以分为三类划分式聚类方法Partition-based Methods、基于密度的聚类方法Density-based methods和层次化聚类方法Hierarchical Methods等。
划分式聚类方法该类方法需要事先指定簇类的数目或者聚类中心通过反复迭代直至最后达到簇内的点足够近簇间的点足够远的目标。经典的划分式聚类方法有K-meansK-均值等。基于密度的聚类方法基于密度的聚类方法可以在有噪音的数据中发现各种形状和各种大小的簇。其核心思想就是先发现密度较高的点然后把相近的高密度点逐步都连成一片进而生成各种簇。经典的基于密度的聚类方法有mean-shift均值漂移、DBSCAN算法等。层次化聚类方法 层次聚类算法Hierarchical clustering将数据集划分为一层一层的 clusters后面一层生成的 clusters 基于前面一层的结果。层次聚类算法一般分为两类Agglomerative 层次聚类又称自底向上bottom-up的层次聚类以及Divisive 层次聚类 又称自顶向下top-down的层次聚类。经典的基于密度的聚类方法有BIRCH算法等。
除此之外还有一些高级的方法如谱聚类Spectral Clustering 其主要思想是把所有的数据看做空间中的点这些点之间可以用边连接起来。距离较远的两个点之间的边权重值较低而距离较近的两个点之间的边权重值较高通过对所有数据点组成的图进行切图让切图后不同的子图间边权重和尽可能的低而子图内的边权重和尽可能的高从而达到聚类的目的。
X.1.2 Sklearn聚类子模块
在Sklearn的cluster聚类子模块中提供了上述几种典型的聚类算法具体函数名称见下表 Sklearn中聚类模块主要算法一览表 X.2 K均值聚类
原理