上一篇文章介绍了无监督学习中的几个重要的术语,后面的文章继续介绍无监督学习中的几个经典算法。
K聚类(K-Means)
K聚类跟之前介绍的最近邻居法(K nearest Neighbours (KNN))非常相似。区别是最近邻居法的数据是已经标记过的并且K是指选择邻居的数量,而K聚类的数据是没有标记过的,K是指类的数量(就是有多少个类)。
算法也很简单,直接上动图
如上图,当K=3 的时候,先随机选择三个点的中心将数据分成三类。然后找到每一类数据中的中心点(平均距离最近的点)来替代第一次随机分配的点,这样就完成了第一次的迭代。反复多次,真正的3个中心点就会找到,于是就完成了类的聚集。
Thanks for reading my posts and welcome to comment. If you like my post , please upvote , resteem and follow me @hongtao
感谢您的阅读,欢迎留言,如果您喜欢我的帖子,请帮忙点赞、推送及关注我 @hongtao