news 2026/2/8 10:10:10

在大模型班学算法的笔记记录-形态学

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
在大模型班学算法的笔记记录-形态学

形态学操作是OpenCV中处理二值图像的核心手段,常用于目标检测、图像降噪、轮廓提取等场景

一、核心流程:从原图到二值化

形态学操作的前提是得到干净的二值图像,核心步骤为:灰度图 → 低通滤波 → 二值化

1. 灰度图转换

彩色图像需先转为灰度图(单通道),减少计算量,聚焦像素亮度信息:

import cv2 import numpy as np # 读取灰度图(参数0表示灰度模式) path = r"/Users/yangjunhui/Desktop/lenaNoise.png" img = cv2.imread(path, 0)

2. 低通滤波:去除噪声

原始图像可能存在椒盐噪声,用高斯滤波(低通滤波的一种)平滑图像,保留主体的同时弱化噪点:

# 高斯滤波:(5,5)为滤波核尺寸,0为标准差(自动计算) blur = cv2.GaussianBlur(img,(5,5),0)

作用:模糊图像边缘,减少后续二值化的噪点干扰。

3. 二值化:黑白分离

将灰度图转为仅含0(黑)、255(白)的二值图像,突出目标区域:

# 二值化:阈值35,超过则设为255(白),否则0(黑) ret, ths1_img = cv2.threshold(blur, 35, 255, cv2.THRESH_BINARY)

关键:阈值需根据图像调整,目标是让主体为白色,背景为黑色。

二、形态学核心操作:腐蚀与膨胀

二值化后,通过腐蚀/膨胀调整目标区域的形态,解决“毛刺”“孔洞”等问题。

1. 先搞懂:形态学核(Kernel)

操作的“工具”是卷积核,决定腐蚀/膨胀的范围和形状:

# 自定义3×3全1核(常用尺寸,可根据需求调整为5×5、7×7等) kernel = np.ones((3,3), np.uint8)
  • np.ones((3,3)):生成3行3列全1矩阵,代表以当前像素为中心,覆盖周围8个像素;
  • np.uint8:像素值专用类型(0-255),保证计算兼容。

OpenCV也提供预设核(无需手动定义):

# 矩形核(默认) kernel_rect = cv2.getStructuringElement(cv2.MORPH_RECT, (5,5)) # 椭圆核(更贴合圆形目标) kernel_ellipse = cv2.getStructuringElement(cv2.MORPH_ELLIPSE, (5,5))

2. 腐蚀(Erosion):去毛刺、瘦化目标

原理

用核扫描每个像素,仅当核覆盖的所有像素都是白色(255)时,中心像素才保留白色,否则设为黑色

代码实现

# 腐蚀操作:迭代1次(次数越多,腐蚀越强) erosion_img = cv2.erode(ths1_img, kernel, iterations = 1) # 显示结果(自定义显示函数) def show(img, title=''): cv2.imshow(title, img) cv2.waitKey(0) show(erosion_img, '腐蚀后')

效果

  • 白色前景区域“收缩”,边缘被侵蚀,细小花絮/毛刺(噪点)被消除;
  • 孤立的白色小噪点(如单个像素)会被完全去掉;
  • 目标区域之间的窄连接可能被断开。

适用场景:去除二值图中的白色噪点、细化目标边缘。

3. 膨胀(Dilation):填孔洞、加粗目标

原理

与腐蚀相反,核扫描时只要覆盖区域内有至少一个白色像素,中心像素就设为白色

代码实现

# 膨胀操作:迭代1次 dilate_img = cv2.dilate(ths1_img, kernel, iterations=1) show(dilate_img, '膨胀后')

效果

  • 白色前景区域“扩张”,细小孔洞/断裂处被填充;
  • 目标边缘变粗,孤立的黑色小噪点被覆盖;
  • 断裂的线条可被重新连接。

适用场景:填补目标区域的黑色孔洞、连接断裂的轮廓。

4. 拓展:形态学梯度

通过“膨胀-腐蚀”“膨胀-原图”或“原图-腐蚀”,可提取目标的边缘像素,得到空心轮廓效果,常用于轮廓检测。

四、完整实战代码

import cv2 import numpy as np # 自定义显示函数 def show(img, title=''): cv2.imshow(title, img) cv2.waitKey(0) cv2.destroyWindow(title) # 关闭窗口,避免占用内存 # 1. 读取灰度图 path = r"/Users/yangjunhui/Desktop/lenaNoise.png" img = cv2.imread(path, 0) show(img, '原始灰度图') # 2. 高斯滤波降噪 blur = cv2.GaussianBlur(img, (5,5), 0) show(blur, '高斯滤波后') # 3. 二值化 ret, ths1_img = cv2.threshold(blur, 35, 255, cv2.THRESH_BINARY) show(ths1_img, '二值化后') # 4. 定义形态学核 kernel = np.ones((3,3), np.uint8) # 5. 腐蚀操作 erosion_img = cv2.erode(ths1_img, kernel, iterations=1) show(erosion_img, '腐蚀后') # 6. 膨胀操作 dilate_img = cv2.dilate(ths1_img, kernel, iterations=1) show(dilate_img, '膨胀后')

五、总结

操作核心效果适用场景
腐蚀去毛刺、瘦化目标消除白色噪点、细化边缘
膨胀填孔洞、加粗目标填补黑色孔洞、连接断裂轮廓
梯度提取边缘、生成空心轮廓目标轮廓检测

形态学操作的关键是“先腐蚀去噪,再膨胀修复”(开运算),或“先膨胀填洞,再腐蚀还原”(闭运算),灵活组合可解决大部分二值图处理问题。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/6 20:37:38

为什么你的Dify响应时间这么长?,混合检索调优的9个隐藏陷阱

第一章:混合检索的 Dify 响应时间在构建现代 AI 应用时,响应时间是衡量系统性能的关键指标之一。Dify 作为一个支持可视化编排的智能应用开发平台,其核心优势在于融合了向量检索与关键词检索的混合检索机制。该机制在保障召回率的同时&#x…

作者头像 李华
网站建设 2026/2/7 13:10:24

Windows任务管理器的作用

Windows 任务管理器是一个比设备管理器更常用、功能更强大的核心工具。它不仅是“结束程序”的利器,更是监控和管理系统性能、启动项、用户进程和服务的高级控制台。 一、任务管理器是什么? 它是 Windows 内置的实时监控和管理工具,允许你查看…

作者头像 李华
网站建设 2026/2/6 18:29:15

C语言实现memcmp函数功能(附带源码)

一、项目背景详细介绍在C语言标准库中,memcmp 是一个非常重要且底层的函数,用于按字节比较两段内存区域的内容。与 strcmp 不同,memcmp 并不关心数据类型或字符串结束符,它只关心:在指定的字节数范围内,两块…

作者头像 李华
网站建设 2026/2/8 9:20:51

接口自动化框架里常用的小工具

在日常编程工作中,我们常常需要处理各种与时间、数据格式及配置文件相关的问题。本文整理了一系列实用的Python代码片段,涵盖了日期时间转换、数据格式化与转换、获取文件注释以及读取配置文件等内容,助力开发者提升工作效率,轻松…

作者头像 李华
网站建设 2026/2/7 9:41:58

大模型转行攻略:从零到高薪,四大方向+实战路线图(建议收藏)

本文详解大模型转行攻略,介绍四大方向(数据、平台、应用、部署),分析新人三大误区,并提供实用入门建议和三阶段路线图。文章强调选对方向、打好基础、注重工程能力的重要性,帮助读者在大模型领域少走弯路&a…

作者头像 李华
网站建设 2026/2/3 13:16:30

07-上下文感知的RAG案例

实现了一个带上下文记忆的 RAG(检索增强生成)问答系统,核心能力是: 1.从指定网页加载 Agent 相关知识并构建向量数据库; 2.基于用户问题从向量库检索相关上下文; 3.结合聊天历史理解用户问题(比…

作者头像 李华