news 2026/4/15 2:02:44

基于深度学习的图像增强-zeros-DCE模型源码分享

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于深度学习的图像增强-zeros-DCE模型源码分享

这个系统可以帮助我们将曝光不足的暗淡图片处理成曝光正常的清晰图像。

下面我将详细介绍这个系统的原理、演示效果、代码实现以及训练方法。

如果你感兴趣,欢迎点赞、收藏和关注!

Zero-DCE模型在不同迭代下的图像增强效果对比:

对比度图

什么是图像增强?

图像增强指的是将曝光不足、暗淡的图片通过算法处理,得到曝光正常、细节清晰的图像。

例如,一张夜晚拍摄的照片,可能因为光线不足而看起来很模糊,经过增强后,就能看到更多细节,如绿植、房屋等。

什么是图像增强

这个系统基于GitHub上的开源项目Zero-DCE模型。

这是一个几年前比较火的低光照图像增强模型。其核心思想是将图像增强抽象成一个增强曲线来进行训练,而不需要成对的低曝光和高曝光图像作为参考。

这就是为什么它叫“Zero-Reference”(零参考),不需要依赖参考图像进行训练,这是一个很大的优点。

Zero-DCE开源地址:https://github.com/Li-Chongyi/Zero-DCE

演示效果

让我们来看一些演示效果。系统处理速度很快,只需几秒钟就能输出结果。

国外街道示例:左侧是原图,暗淡无光;经过处理后,右侧得到曝光正常的图片,细节更丰富。

街道对比

野外景色示例:原图中绿植模糊不清,增强后一下子看得非常清楚。

野外对比

夜晚图像示例:如月球上的图片或小房屋,原图几乎漆黑,增强后变得清晰明亮。

月球对比

这些效果是通过PyQt5界面封装的,你可以直接打开图片,进行增强处理,并保存结果。

我已经将模型和界面打包在一起,方便使用。

代码实现

下面是完整的代码实现。这是一个使用PyQt5构建的GUI应用,集成了Zero-DCE模型。代码包括图像加载、模型推理、结果显示和保存功能。

python

from datetime import datetime

import math

import sys

from shibie import Ui_MainWindow

from PyQt5.QtWidgets import *

from PyQt5 import QtCore, QtGui, QtWidgets

from PyQt5.QtCore import *

from PyQt5.QtGui import *

import cv2 as cv

import numpy as np

import os

import time

import matplotlib.pyplot as plt

import torch

import torch.nn as nn

from torchvision import transforms

from PIL import Image

import model

class ImageProcess(QMainWindow, Ui_MainWindow):

def __init__(self, parent=None):

super(ImageProcess, self).__init__()

self.setupUi(self)

self.device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# 3. 加载模型

self.DCE_net = model.enhance_net_nopool().to(self.device)

self.DCE_net.load_state_dict(torch.load('snapshots/Epoch99.pth', map_location=self.device))

self.DCE_net.eval()

def paintEvent(self, event):

painter = QPainter(self)

pixmap = QPixmap("main_background.jpg") # 加载背景图片

painter.drawPixmap(self.rect(), pixmap) # 将图片拉伸填充整个窗口

painter.end()

def cv_imread(self,filePath):

cv_img = cv.imdecode(np.fromfile(filePath, dtype=np.uint8), -1)

return cv_img

def dakaituxiang(self):

filename, _ = QFileDialog.getOpenFileName(self, '打开图片')

if filename:

# self.captured = cv.imdecode(np.fromfile(filename,dtype=np.uint8),-1)

self.captured = self.cv_imread(str(filename))

self.image_path = filename

# self.captured = cv.imread(str(filename))

# OpenCV图像以BGR通道存储,显示时需要从BGR转到RGB

# self.captured = cv.cvtColor(self.captured, cv.COLOR_BGR2RGB)

rows, cols, channels = self.captured.shape

bytesPerLine = channels * cols

cv_img=cv.cvtColor(self.captured,cv.COLOR_RGB2BGR)

QImg = QImage(cv_img.data, cols, rows,

bytesPerLine, QImage.Format_RGB888)

self.timecha = 0

self.result_tu = self.captured

self.axes_yuantu.setPixmap(QPixmap.fromImage(QImg).scaled(

self.axes_yuantu.size(), Qt.KeepAspectRatio, Qt.SmoothTransformation))

def btn_save(self):

if hasattr(self, 'result_tu') and self.result_tu is not None:

filename, _ = QFileDialog.getSaveFileName(self, '保存图片', '', 'Images (*.png *.jpg *.bmp)')

if filename:

cv.imwrite(filename, cv.cvtColor(self.result_tu, cv.COLOR_RGB2BGR))

QMessageBox.information(self, '提示', '图片保存成功!')

else:

QMessageBox.warning(self, '警告', '没有可保存的图像!')

def btnzero(self):

original_img = Image.open(self.image_path).convert('RGB')

starttime = time.time()

# 2. 图像预处理

transform = transforms.Compose([

transforms.ToTensor(),

])

img_tensor = transform(original_img).unsqueeze(0).to(self.device)

with torch.no_grad():

_, enhanced_img, _ = self.DCE_net(img_tensor)

# 后处理

enhanced_img = enhanced_img.squeeze(0).permute(1, 2, 0).cpu().numpy()

enhanced_img = np.clip(enhanced_img * 255, 0, 255).astype(np.uint8)

enhanced_img = Image.fromarray(enhanced_img)

enhanced_img = np.array(enhanced_img) # 直接转 NumPy 数组

enhanced_img = cv.cvtColor(enhanced_img, cv.COLOR_RGB2BGR)

enhanced_img = cv.cvtColor(enhanced_img, cv.COLOR_BGR2RGB)

endtime = time.time()

timecha = (endtime - starttime) * 1000

timecha = round(timecha, 2)

self.timecha = timecha

self.result_tu = enhanced_img

# 8. 显示结果

cv_img = enhanced_img

rows, cols, channels = enhanced_img.shape

bytesPerLine = channels * cols

QImg = QImage(cv_img.data, cols, rows,bytesPerLine, QImage.Format_RGB888)

# 显示在GUI的axes_quzao区域(可根据需要修改为其他QLabel)

self.axes_bianyuan_2.setPixmap(QPixmap.fromImage(QImg).scaled(

self.axes_bianyuan_2.size(), Qt.KeepAspectRatio, Qt.SmoothTransformation))

return

if __name__ == '__main__':

app = QApplication(sys.argv)

window = ImageProcess()

window.show()

sys.exit(app.exec_())

代码说明

初始化:加载Zero-DCE模型,使用预训练权重Epoch99.pth。

打开图片:通过dakaituxiang方法选择并显示原图,支持中文路径。

增强处理:btnzero方法使用Torch进行图像预处理、模型推理和后处理,输出增强图像。

保存:btn_save方法保存增强后的图像。

界面:使用PyQt5,背景图片为main_background.jpg,结果显示在指定Label中。

二次训练

系统还提供了二次训练功能。你可以在data/train_data文件夹中使用作者提供的约2000张不同曝光程度的图像进行训练。运行训练函数时,可能需要调整一些旧代码(我已经做过优化,确保运行OK)。训练记录会保存,过程大约需要几个小时,取决于硬件。

例如,训练后你可以得到更好的模型,适应特定场景。

结语

这就是基于深度学习的图像增强系统分享。如果你想获取完整代码和打包文件,欢迎在评论区留下邮箱,我会发给你。记得三连支持哦!如果有问题,随时讨论。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/14 14:08:33

单步生成革命:OpenAI一致性模型如何重塑AI图像创作效率

导语 【免费下载链接】diffusers-ct_cat256 项目地址: https://ai.gitcode.com/hf_mirrors/openai/diffusers-ct_cat256 OpenAI推出的Consistency Model(一致性模型)通过一步生成高质量图像的技术突破,正在重新定义AI创作工具的效率标…

作者头像 李华
网站建设 2026/4/9 15:46:23

如何快速掌握active-win:跨平台窗口信息获取终极指南

如何快速掌握active-win:跨平台窗口信息获取终极指南 【免费下载链接】active-win Get metadata about the active window (title, id, bounds, owner, etc) 项目地址: https://gitcode.com/gh_mirrors/ac/active-win 在现代多任务工作环境中,窗口…

作者头像 李华
网站建设 2026/4/9 21:27:36

CMake项目构建实战指南:从开发痛点分析到高效解决方案

作为现代C开发者,您是否经常面临项目构建的困扰?跨平台兼容性问题、复杂的依赖管理、繁琐的构建配置...这些痛点不仅消耗宝贵开发时间,更影响项目交付质量。本文将为您揭示如何通过精选的CMake模板和跨平台构建工具,彻底解决这些开…

作者头像 李华
网站建设 2026/4/13 13:58:40

KVCache vs 传统缓存:大模型推理效率提升300%的秘密

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个基准测试平台,对比分析KVCache与传统缓存方案:1.实现标准的注意力计算流程 2.集成KVCache优化版本 3.添加常见缓存策略(如memcached&…

作者头像 李华
网站建设 2026/4/13 6:40:37

GPT-5.2震撼发布:从Code Red到人类专家水平的AI跃迁

OpenAI发布GPT-5.2模型,这是"Code Red"计划后的首个成果。该模型在GDPval测试中达到人类专家水平(70.9%-74.1%),抽象推理能力(ARC-AGI-2)从17.6%暴涨至52.9%,数学竞赛获满分,编程准确率达55.6%,多模态错误率…

作者头像 李华