更多免费教程和软件 :
二阶聚类分析
二阶聚类,或TwoStep聚类,也常被称为两步聚类,是一种探索性的分析工具。
二阶聚类法可以基于类别变量和连续变量进行聚类,可以自动确定最终的分类个数,可以处理大型数据集。
二阶聚类整个聚类过程分为前后两个大的板块来完成。
第一步,对所有记录进行距离考察,构建CF分类特征树,同一个树节点内的记录相似度高,相似度差的记录则会生成新的节点。
第二步,在分类树的基础上,使用凝聚法对节点进行分类,每一个聚类结果使用BIC或者AIC进行判断,得出最终的聚类结果。
同其他统计方法一样,二阶聚类也有严苛的适用条件,它要求模型中的变量独立,类别变量是多项式分布,连续变量须是正态分布。
【示例】
汽车生产厂商需要有效的方法评价当前市场情况,了解市场需要,找到受