更多免费教程和软件 :
系统聚类分析
【简介】
系统聚类是实际工作中使用的最多的一种聚类方法,它具有十分明显的优点:可以对样品聚类,也可以对变量聚类,变量可以是连续性变量或分类变量,提供的距离测量方法和结果表示方法也十分丰富。但是由于它要反复计算距离,当样本量太大或变量太多时,采用此法运算速度明显减慢。
【基本思想】
将n个样品或变量看成不同的n类,然后将距离接近(针对样品聚类)或性质接近(针对变量聚类)的两类合并为一类;再从这n-1类中找到最接近的两个类合并,以此类推,直到所有的样品或变量被合为一类。整个过程可以绘成聚类图,按图和具体问题来决定分类。
【示例】
有10名学生参加测试,测试10个指标,尝试对这十个指标进行聚类。