无人机视角城市街道占道经营摆摊街摊贩检测数据集VOC+YOLO格式355张2类别-平芜编程栈

数据集格式：Pascal VOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)

图片数量(jpg文件个数)：355

标注数量(xml文件个数)：355

标注数量(txt文件个数)：355

标注类别数：2

所在github仓库：firc-dataset

标注类别名称(注意yolo格式类别顺序不和这个对应，而以labels文件夹classes.txt为准):["roadside_booths","umbrella"]

每个类别标注的框数：

roadside_booths（占道经营）框数 = 1453

umbrella（雨伞）框数 = 655

总框数：2108

图片分辨率：多分辨率图片,如1920x1080,1920x1440等

无人机：DJI MAVIC 3

采集高度：30m

采集角度：90°

使用标注工具：labelImg

标注规则：对类别进行画矩形框

重要说明：暂无

特别声明：本数据集不对训练的模型或者权重文件精度作任何保证

图片预览：

标注例子：

Z-Image-Turbo使用心得：本地生成图像的安全与便捷你是否曾为一张教学配图反复修改PS图层？是否担心把客户产品草图上传到在线AI平台后被二次使用？又或者，只是单纯想在周末安静地生成一组风格统一的插画，不被算法推荐、…

李华

位移参数影响出图质量？Qwen-Image调试心得你有没有遇到过这样的情况：明明提示词写得清清楚楚，模型也跑起来了，可生成的图片不是文字模糊、排版歪斜，就是主体失真、细节糊成一片？在反复测试Qwen-Image-251…

李华

Qwen3-0.6B真实体验：轻量模型适合初学者 [【免费下载链接】Qwen3-0.6B Qwen3 是通义千问系列最新一代开源大语言模型，2025年4月正式发布，涵盖从0.6B到235B的多档位密集模型与MoE架构。其中Qwen3-0.6B以极低资源占用、开箱即用体验和清晰可理…

李华

YOLOv12镜像训练时崩溃？这份调参建议请收好 YOLOv12不是简单的版本迭代，而是一次架构范式的跃迁——它用注意力机制彻底重构了实时目标检测的底层逻辑。但正因如此，它的训练行为与传统YOLO系列（v5/v8/v10）存在本质差异…

李华

法律口述记录神器，Paraformer支持原告被告热词在法院庭审、律师访谈、调解现场等法律场景中，语音转文字不是“锦上添花”，而是刚需——手写记录易遗漏、速录员成本高、通用ASR识别不准专有名词。你是否遇到过这些情况： 录音里反…

李华

下载结果只需一点，生成文件自动命名你有没有遇到过这样的情况：辛辛苦苦等了几秒把人像转成卡通风格，结果点下载时发现文件名是乱码、时间戳太长、根本分不清哪张图对应哪次参数？更别说批量处理几十张照片后，一堆 out…

李华