news 2026/2/22 19:58:32

人工智能训练师认证教程(1)数据标注-Labelimg的使用教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
人工智能训练师认证教程(1)数据标注-Labelimg的使用教程

目录

一、LabelImg 简介

二、安装方法

Windows 系统

macOS 系统

Linux 系统

三、基本界面介绍

四、完整标注流程

步骤1:准备工作

步骤2:打开标注工具

步骤3:设置参数

步骤4:开始标注

步骤5:保存和导航

五、常用快捷键

六、标注规范与技巧

标注原则

提高效率的技巧

七、输出格式说明

1. PASCAL VOC 格式(XML)

2. YOLO 格式(TXT)

八、常见问题解决

问题1:无法保存标注

问题2:标签不显示

问题3:快捷键无效

九、高级功能

自动标注

批量转换格式

质量检查

十、最佳实践建议

十一、后续步骤

学习资源


一、LabelImg 简介

LabelImg 是一款开源的图像标注工具,主要用于为机器学习项目创建标注数据集。它支持多种标注格式,包括:

  • PASCAL VOC(.xml 文件)

  • YOLO(.txt 文件)

  • CreateML(JSON 文件)

我们使用的标注工具是labelimg,接下来详细讲解如果安装使用labelimg。

labelimg 只支持矩形标注,如果需要更精准的多边形标准,可以使用labelme。

二、安装方法

Windows 系统

bash

# 方法1:使用 pip 安装(需先安装 Python) pip install labelImg # 方法2:下载预编译的 exe 文件 # 访问 GitHub 仓库下载最新版本

macOS 系统

bash

brew install python3 pip3 install labelImg labelImg # 启动

Linux 系统

bash

sudo apt-get install pyqt5-dev-tools pip3 install labelImg labelImg

三、基本界面介绍

启动 LabelImg 后,界面主要分为以下区域:

  1. 菜单栏:文件操作、设置等

  2. 工具栏:常用功能快捷按钮

  3. 图像显示区:显示待标注图像

  4. 文件列表区:显示文件夹中的图像文件

  5. 标注列表区:显示当前图像的所有标注框

四、完整标注流程

步骤1:准备工作

  1. 创建项目文件夹结构:

text

project/ ├── images/ # 存放原始图片 ├── annotations/ # 存放标注文件 └── classes.txt # 类别列表文件
  1. 创建classes.txt,每行一个类别名称:

text

person car dog cat

步骤2:打开标注工具

bash

# 启动 LabelImg labelImg # 或者指定图片文件夹 labelImg [图片文件夹路径]

步骤3:设置参数

  1. 选择标注格式

    • ViewUse default labelUse label.txt file

    • 选择labels.txt文件路径

  2. 设置保存路径

    • FileChange Save Dir选择保存标注文件的目录

步骤4:开始标注

  1. 打开图像文件夹

    • FileOpen Dir选择图片文件夹

  2. 创建标注框

    • W键或点击Create RectBox按钮

    • 在目标物体周围拖动鼠标绘制边界框

    • 选择类别标签(或手动输入)

    • 点击OK完成

  3. 调整标注框

    • 拖动边界框调整位置和大小

    • 右键标注框可删除或修改类别

步骤5:保存和导航

  1. 保存标注

    • Ctrl+S或点击Save保存当前标注

    • Ctrl+Shift+S自动保存并跳转到下一张

  2. 图像导航

    • 上一张:A

    • 下一张:D

    • 跳转到指定图像:滚动文件列表

五、常用快捷键

快捷键功能
W创建边界框
Ctrl + S保存当前标注
Ctrl + Shift + S保存并下一张
A/上一张图像
D/下一张图像
Ctrl + D复制当前标注框
Del删除选中标注框
Ctrl + +放大图像
Ctrl + -缩小图像
Space标记为已验证
Ctrl + R修改默认标注文件夹

六、标注规范与技巧

标注原则

  1. 边界框贴合:尽量紧密包围目标物体

  2. 完整性:确保目标完全在框内

  3. 一致性:同类物体使用相同标注标准

  4. 遮挡处理:部分遮挡的物体仍应标注完整形状

提高效率的技巧

  1. 批量操作

    • 先快速标记所有同类别物体

    • 再统一调整边界框

  2. 复制粘贴

    • 相似物体可复制标注框后微调

  3. 使用预设标签

    • 提前设置好常用类别,减少手动输入

七、输出格式说明

1. PASCAL VOC 格式(XML)

xml

<annotation> <folder>images</folder> <filename>image1.jpg</filename> <size> <width>1920</width> <height>1080</height> <depth>3</depth> </size> <object> <name>person</name> <bndbox> <xmin>100</xmin> <ymin>200</ymin> <xmax>300</xmax> <ymax>400</ymax> </bndbox> </object> </annotation>

2. YOLO 格式(TXT)

text

# class_id center_x center_y width height 0 0.5 0.6 0.2 0.3
  • 坐标已归一化(0-1)

  • 每个物体一行

八、常见问题解决

问题1:无法保存标注

解决方法

  1. 确保选择了保存目录

  2. 检查文件写入权限

  3. 关闭文件占用程序

问题2:标签不显示

解决方法

  1. 检查classes.txt格式是否正确

  2. 重新加载标签文件

  3. 确认文件编码为 UTF-8

问题3:快捷键无效

解决方法

  1. 确保焦点在图像区域

  2. 检查快捷键冲突

  3. 重启 LabelImg

九、高级功能

自动标注

bash

# 使用预训练模型辅助标注 # 需要集成外部工具或自行开发

批量转换格式

python

# 使用脚本转换 VOC 到 YOLO import xml.etree.ElementTree as ET # 转换代码...

质量检查

  1. 使用Space标记已验证图像

  2. 开发脚本检查标注一致性

  3. 使用可视化工具验证标注

十、最佳实践建议

  1. 团队协作

    • 建立统一的标注规范文档

    • 定期进行标注一致性检查

    • 使用版本控制管理标注文件

  2. 质量控制

    • 设置验收标准

    • 进行交叉验证

    • 统计标注质量指标

  3. 效率优化

    • 对相似图像分组标注

    • 使用快捷键熟练操作

    • 定期备份标注数据

十一、后续步骤

完成标注后:

  1. 数据划分:分为训练集、验证集、测试集

  2. 格式转换:根据需要转换为目标框架格式

  3. 数据增强:扩展数据集规模

  4. 模型训练:使用标注数据训练目标检测模型

学习资源

  • 官方 GitHub 仓库

  • 视频教程

  • 标注规范模板

这个教程涵盖了 LabelImg 的基本使用到高级技巧,建议先从简单的项目开始练习,熟练掌握后再进行大规模标注任务。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/15 18:24:22

FaceFusion局域网访问设置方法

FaceFusion局域网访问设置方法 在使用 FaceFusion 这类基于 Web UI 的人脸替换与增强工具时&#xff0c;很多用户会遇到一个常见需求&#xff1a;希望在局域网内的其他设备&#xff08;如平板、手机或其他电脑&#xff09;上也能访问和操作 FaceFusion 界面。这在团队协作、远…

作者头像 李华
网站建设 2026/2/21 2:59:36

Stable Diffusion 3.5 发布:图像生成新突破

Stable Diffusion 3.5 FP8 发布&#xff1a;图像生成效率的新拐点 你有没有遇到过这种情况&#xff1f;明明写好了精炼的提示词&#xff0c;构图、光影、风格都描述得清清楚楚&#xff0c;结果模型要么“选择性失明”&#xff0c;要么生成一堆模糊拼贴——更别提在16GB显存的消…

作者头像 李华
网站建设 2026/2/16 12:53:18

未来的App不再需要菜单栏?

2013年&#xff0c;电影《她》&#xff08;Her&#xff09;描绘了一个令人着迷又略带不安的未来&#xff1a;人类与操作系统通过自然语言持续对话&#xff0c;AI不仅理解语义&#xff0c;还能感知情绪、记住过往、主动推理——它不再是工具&#xff0c;而是一个“认知伙伴”。 …

作者头像 李华
网站建设 2026/2/22 4:45:48

Flutter 勇闯2D像素游戏之路(三):人物与地图元素的交互

Flutter 勇闯2D像素游戏之路&#xff08;一&#xff09;&#xff1a;一个 Hero 的诞生 Flutter 勇闯2D像素游戏之路&#xff08;二&#xff09;&#xff1a;绘制加载游戏地图 Flutter 勇闯2D像素游戏之路&#xff08;三&#xff09;&#xff1a;人物与地图元素的交互 前言 在…

作者头像 李华
网站建设 2026/2/21 7:11:48

用PyTorch实现轴承故障诊断:多尺度卷积+注意力机制实战

基于多尺度卷积神经网络的滚动轴承故障诊断 针对传统方法在难以自适应提取滚动轴承有效故障特征信息的问题&#xff0c;提出了一种多尺度卷积神经网络的滚动轴承故障诊断方法。 首先&#xff0c;构建了多尺度特征融合模块自适应提取故障样本不同感受野下的特征表示&#xff0c;…

作者头像 李华
网站建设 2026/2/20 8:27:52

基于matlab的凸轮轮廓的设计计算与绘图 计算此结构的最优化参数,根据其原理输出推程和回程的...

基于matlab的凸轮轮廓的设计计算与绘图 计算此结构的最优化参数&#xff0c;根据其原理输出推程和回程的最大压力角、最小曲率半径等相关结果。 程序已调通&#xff0c;可直接运行。打开MATLAB的脚本编辑器&#xff0c;迎面扑来的是熟悉的蓝色界面。咱们今天要折腾的这个凸轮设…

作者头像 李华