模式识别(3)Kmeans和FCM

人工智能104

Kmeans和FCM

Kmeans算法作为应用最广泛的基于划分的聚类算法之一,适用于处理大样本数据。是一种典型的基于相似性度量的方法,目标是根据输入参数K将数据集划分为K类。由于初始值,相似度,聚类均值计算策略的不同,因而有很多种K均值算法的变种。在数据接近球形分布的时候,K均值算法具有较好的聚类效果。
K均值算法属于硬聚类算法,它把数据点划分到确切的某一聚类中。而模糊聚类则是软聚类,数据点可能归属于不止一个聚类,并且这些聚类与数据点通过一个成员水平联系起来。成员水平显示了数据点与某一聚类之间联系很密切。模糊聚类就是计算这些成员水平,按照成员水平来决定数据点属于哪一个或哪些聚类的过程。

一、问题描述

1、查阅无监督聚类的评价标准有哪些?选择其中一个标准作为后续试验的验证指标。
2、sonar和iris数据上分别验证两种聚类算法,同时,也可以先利用kmeans算法选择初始聚类中心,然后使用FCM聚类,观察其结果。

二、数据集说明

2.1 Iris数据集

Iris数据集,是一个多分类问题,每个类的观察值数量是均等的,一共有150个观察值,4个输入变量和1个输出变量,其通过对鸢尾花的测量数据预测鸢尾花的品种。

2.2 Sonar数据集

Sonar数据集提供了208组60维的声纳观测集数据,用来预测给定声纳从不同角度返回的强度预测目标是岩石还是矿井。其中R类代表岩石,M类代表矿井。

输入验证码查看隐藏内容

扫描二维码关注本站微信公众号 Johngo学长
或者在微信里搜索 Johngo学长
回复 svip 获取验证码
wechat Johngo学长