news 2026/5/11 21:31:01

内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
内镜检查腺瘤性息肉和增生性息肉识别数据集,正确识别率可达99.4%,已标注好,支持yolo,coco json,pascal voc xml

数据集概述

在消化道疾病早筛领域,息肉的精准识别与分型(尤其是腺瘤性与增生性息肉的区分)是降低癌变风险的关键 —— 腺瘤性息肉存在明确恶变倾向,需重点监测,而增生性息肉多为良性,临床处理策略差异显著。基于此,我们构建了一套高质量息肉检测标注数据集,为医疗 AI 算法研发提供核心支撑。

数据集核心规格:高质量标注,多格式兼容

本数据集聚焦消化道息肉检测与分型需求,在数据规模、标注精度与格式兼容性上均具备显著优势:

  • 数据规模与多样性:包含9248张原始临床图片,均来源于真实消化道内镜检查场景,覆盖不同患者年龄层、内镜设备型号及息肉生长部位(如胃底、结肠、直肠等),同时涵盖息肉不同大小(2-20mm)、形态(扁平状、隆起状、带蒂状)及光照环境,确保数据分布贴近临床实际,提升算法泛化能力。
  • 标注精度与分型能力:所有图片均由 3 名资深消化科医师联合标注,采用 “边界框定位 + 病理类型标注” 双维度标注模式,精准区分腺瘤性息肉增生性息肉两类核心目标;经第三方临床验证,数据集对两类息肉的综合识别率达94.8%,边界框标注 IoU(交并比)均值超 0.89,满足医疗 AI 算法训练的高精度需求。
  • 多格式兼容:支持当前主流目标检测算法的标注格式,无需二次转换即可直接使用 —— 包括 YOLO 系列算法专用的.txt格式、通用目标检测标准的COCO JSON格式,以及传统算法常用的Pascal VOC XML格式,适配 PyTorch、TensorFlow 等主流深度学习框架,降低算法研发的数据集适配成本。

核心使用场景:覆盖医疗 AI 全链路研发

数据集可深度支撑消化道息肉检测相关 AI 技术的研发、验证与落地,核心应用场景包括:

  1. 息肉检测与分型算法训练作为基础训练数据,用于开发 “实时息肉检测 + 自动分型”AI 模型 —— 例如在消化内镜检查中,辅助医生实时识别息肉位置,并快速判断其为腺瘤性(高风险)或增生性(低风险),减少漏诊、误诊,尤其适用于基层医疗机构缺乏资深医师的场景。
  2. 算法性能验证与对比提供标准化的测试集(按 7:2:1 划分为训练 / 验证 / 测试集),可用于不同算法(如 YOLOv8、Faster R-CNN、Transformer-based 检测模型)的性能对比,或同一算法在迭代过程中的精度、速度优化验证,为算法选型与改进提供客观评价依据。
  3. 医疗 AI 产品落地适配支持与临床内镜设备的集成测试,数据集包含的复杂场景(如消化道分泌物遮挡、息肉边缘模糊)可帮助 AI 模型优化鲁棒性,加速 “AI 辅助诊断系统” 从实验室走向临床,例如集成到内镜工作站,实时输出息肉检测结果与分型建议。

数据集训练指标

训练图:

标签信息:

AP MP

1. AP:最常见为「腺瘤性息肉(Adenomatous Polyp)」

  • 核心含义:内镜报告中若标注 “AP”,90% 以上指向腺瘤性息肉,这是消化道内镜(尤其是肠镜、胃镜)中高频出现的表述 —— 腺瘤性息肉是具有潜在恶变风险的良性病变,需重点监测或干预(如内镜下切除),与之前提到的 “adenomatous polyp” 直接对应。

  • 场景示例:肠镜报告中 “升结肠见 1 枚 AP,直径 0.6cm”,即 “升结肠发现 1 枚腺瘤性息肉,大小 0.6 厘米”。

2. MP:需结合内镜类型区分,核心有 2 类常见含义

(1)消化道内镜:多为「增生性息肉(Hyperplastic Polyp)」

  • 核心含义:与 “AP” 对应,“MP” 可能是 “Hyperplastic Polyp” 的简化标注(部分机构习惯用 “HP”,但少数场景会简写为 “MP”),特指良性增生性息肉,恶变风险极低,常出现在胃底、结肠等部位。

  • 场景示例:胃镜报告 “胃底多发 MP,直径 0.2-0.3cm”,即 “胃底有多个增生性息肉,大小 0.2-0.3 厘米”。

(2)支气管镜 / 喉镜:可能为「中叶(Middle Lobe)」

  • 核心含义:在呼吸道内镜检查中,“MP” 可能指代肺部 “中叶”(如右肺中叶 Middle Lobe),用于标注病变位置,而非息肉类型。

  • 场景示例:支气管镜报告 “MP 开口处黏膜充血”,即 “右肺中叶开口处黏膜有充血表现”。

数据集拆分

训练集:
6477图片
验证集
1844图片
测试集
927图片

预处理

自动定向: 应用
调整大小: 拉伸至 640x640

增强

未进行任何增强。

数据集图片和标注信息:

数据集下载地址:

yolo v12: https://download.csdn.net/download/pbymw8iwm/92466308

yolo v11:https://download.csdn.net/download/pbymw8iwm/92466420

yolo v9: https://download.csdn.net/download/pbymw8iwm/92466315

yolo v8:https://download.csdn.net/download/pbymw8iwm/92466318

yolo v7: https://download.csdn.net/download/pbymw8iwm/92466733

yolo v5: https://download.csdn.net/download/pbymw8iwm/92466738

coco json: https://download.csdn.net/download/pbymw8iwm/92466756

pascal voc xml: https://download.csdn.net/download/pbymw8iwm/92466742

yolo darknet: https://download.csdn.net/download/pbymw8iwm/92466746

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/10 18:14:05

开源替代SaaS:一次部署长期受益,多维表格自建方案全解析

数字化浪潮下,企业对数据协作的需求已从简单的表格记录升级为"实时同步、权限管控、系统集成"的复合型需求。传统Excel的版本混乱、数据孤岛问题日益凸显,而Airtable等SaaS工具的年度订阅费动辄数万元,还存在数据主权归属的隐患。 …

作者头像 李华
网站建设 2026/5/11 4:56:58

考虑寿命损耗的微网电池储能容量优化配置 关键词:两阶段鲁棒优化 KKT条件 CCG算法 寿命损耗

考虑寿命损耗的微网电池储能容量优化配置 关键词:两阶段鲁棒优化 KKT条件 CCG算法 寿命损耗 风电、光伏、储能以及燃气轮机 微网中电源/储能容量优化配置 matlab代码 参考文档: [1]《考虑寿命损耗的微网电池储能容量优化配置》复现 [2]《微电网两阶段…

作者头像 李华
网站建设 2026/4/30 9:32:24

MySQL主从复制与读写分离实战指南

本文详解MySQL主从复制原理与配置,以及读写分离的实现方案,从单机到高可用架构。前言 单机MySQL的问题: 单点故障读写压力集中无法水平扩展 主从复制是MySQL高可用的基础: 数据冗余,提高可用性读写分离,提升…

作者头像 李华
网站建设 2026/5/3 11:00:19

数字人平台选型指南:四大维度全面解析

一、测评背景与方法论数字人技术已从早期探索阶段迈向规模化落地。行业数据显示,2025 年生成式 AI 产生的数据占比将达到全球数据总量的 10%,人工智能整体产业规模突破 3000 亿美元。在内容生产、营销推广、数字化运营等场景迅速增长的背景下&#xff0c…

作者头像 李华
网站建设 2026/5/10 1:51:33

SGMG-09A6W-YG1伺服电机

SGMG-09A6W-YG1 伺服电机SGMG-09A6W-YG1 是一款高性能工业伺服电机,适用于精密控制场合,如数控机床、工业机器人、自动化生产线及其他高精度机械设备。主要特点:高精度反馈:配备编码器,实现位置、速度和方向的精确控制…

作者头像 李华
网站建设 2026/4/25 15:48:56

GPT-5.2遭全网群嘲,原因竟然是不够人性化!

日前,OpenAI 十周年的日子里,他们如约推出了新的旗舰模型 GPT-5.2。 官方宣传词是「迄今为止在专业知识工作上最强大的模型」,各项基准测试成绩也确实看起来不错。 但就在发布后的几个小时内,整个网络舆论急速反转。 社交媒体上…

作者头像 李华