news 2026/5/20 23:42:22

对角矩阵的层次聚类

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
对角矩阵的层次聚类

对角矩阵(即距离/相似度矩阵)是层次聚类(尤其是凝聚式层次聚类)的核心输入,其计算过程本质是基于距离矩阵不断合并簇、更新矩阵的迭代过程,具体步骤如下:

一、初始化距离矩阵(对角矩阵)

首先对所有N个数据点计算两两之间的距离,构建N×N的对称距离矩阵(对角矩阵,对角线元素为0,代表自身与自身的距离为0)。

- 常用距离度量:欧氏距离、曼哈顿距离等,层次聚类最常用欧氏距离。

- 示例:若有A-G共7个数据点,先计算所有点对的距离,得到对称的距离矩阵,对角线为0,非对角线元素为对应两点的距离。

二、迭代合并与矩阵更新

凝聚式层次聚类的核心迭代逻辑如下,每一步都会更新距离矩阵:

1. 寻找最近簇:在当前的对角矩阵中,找到非对角线距离最小的两个簇(初始时每个数据点就是一个簇)。

- 例如初始矩阵中B和C的距离最小(1.00),则优先合并B、C为一个新簇(B,C)。

2. 合并簇:将距离最近的两个簇合并为一个新簇,此时总簇数减1。

3. 更新距离矩阵:删除原两个簇对应的行和列,新增一行一列代表新簇与其他所有簇的距离,重新计算新簇到其余簇的距离,得到新的对角矩阵。

计算两个簇之间距离(即新行/列的数值)有三种常用标准:

- 单连接(Single Linkage):取两个簇中所有点对的最小距离作为簇间距离,易受极端值影响,可能出现“链式效应”。

- 完全连接(Complete Linkage):取两个簇中所有点对的最大距离作为簇间距离,限制较强,可能忽略整体相近的簇。

- 平均连接(Average Linkage):取两个簇中所有点对的距离均值作为簇间距离,结果更稳定,计算量相对更大。

- 示例:合并(B,C)后,计算新簇(B,C)到A的距离,需取B到A、C到A的距离均值作为簇间距离。

三、终止与结果输出

重复上述“找最近簇-合并-更新矩阵”的步骤,直到满足终止条件:

- 可选终止条件:所有点合并为一个大簇、达到预设的簇数量、最近簇的距离超过设定阈值。

- 最终可通过树状图(dendrogram)可视化整个合并过程,直观展示数据的层次结构,也可通过切割树状图得到指定数量的聚类结果。

补充说明

如果是分裂式层次聚类(自顶向下),则初始将所有点放在一个大簇中,每次分裂时计算簇内点的距离矩阵,将最不相似的子簇拆分,逐步更新矩阵直到每个点自成一类,该方法实际应用较少。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 23:39:52

UWB:直线传播物理局限|镜像:跨镜时空轨迹张量

直线传播物理局限与跨镜时空轨迹张量技术解析UWB:直线传播物理局限|镜像:跨镜时空轨迹张量传统有源定位技术的物理上限,由电磁波直线传播、视距依赖、线性测距的底层物理属性永久锁定,这也是以UWB为代表的射频定位体系…

作者头像 李华
网站建设 2026/5/20 23:36:09

2026年亲测AI论文工具榜单(实测甄选版)

为解决学术写作中效率与合规两大核心痛点,以下精选8款高适配性AI论文写作工具(按综合优先级排序),围绕中文学术规范适配、真实参考文献生成、格式标准化、高性价比四大核心维度筛选,同时配套分场景精准选型方案与学术合…

作者头像 李华
网站建设 2026/5/20 23:36:03

BilibiliDown:免费开源工具,轻松批量下载B站视频的完整指南

BilibiliDown:免费开源工具,轻松批量下载B站视频的完整指南 【免费下载链接】BilibiliDown (GUI-多平台支持) B站 哔哩哔哩 视频下载器。支持稍后再看、收藏夹、UP主视频批量下载|Bilibili Video Downloader 😳 项目地址: https://gitcode.…

作者头像 李华
网站建设 2026/5/20 23:30:05

5分钟快速上手Py-ART:气象雷达数据分析的终极Python工具包

5分钟快速上手Py-ART:气象雷达数据分析的终极Python工具包 【免费下载链接】pyart The Python-ARM Radar Toolkit. A data model driven interactive toolkit for working with weather radar data. 项目地址: https://gitcode.com/gh_mirrors/py/pyart Py-…

作者头像 李华