一、前言
YOLO(You Only Look Once)自2015年诞生以来,已经成为计算机视觉领域最具影响力的实时目标检测算法系列。从V1到V14,YOLO家族不断壮大,背后涉及的作者团队也从Joseph Redmon一人扩展到全球多个实验室。
但一个经常被忽视的事实是:不是每一代YOLO都发表了学术论文,更不是每一篇都中了顶会。YOLOv3在arXiv上发布后从未投稿;YOLOv5根本没有发表过学术论文;YOLOv9、YOLOv10至今仍是以arXiv预印本的形式存在。本文系统梳理YOLO全系列的发展脉络,回答三个核心问题:谁提出的?论文投稿了没有?接收了吗?
二、YOLOv1:一切的原点
提出团队:Joseph Redmon(华盛顿大学)、Santosh Divvala、Ross Girshick、Ali Farhadi
论文标题:You Only Look Once: Unified, Real-Time Object Detection
发表/接收情况:CVPR 2016
标志性创新:将目标检测重新定义为回归问题,从图像直接预测边界框和类别概率,实现了实时端到端的检测。
值得一提的是,这篇论文最初曾投稿到NIPS并被拒稿,评审给出的评价是“这是一篇不错的论文,但还不够好”。随后转投CVPR 2016被接收。
三、YOLOv2 / YOLO9000
提出团队:Joseph Redmon、Ali Farhadi(华盛顿大学)
论文标题:YOLO9000: Better, Faster, Stronger
发表/接收情况:CVPR 2017,获CVPR 2017最佳论文荣誉提名(Best Paper Honorable Mention)
核心贡献:引入Anchor Box机制改进定位精度;联合训练检测与分类,提出可检测9000类物体的YOLO9000,大幅扩展了检测类别上限。
四、YOLOv3
提出团队:Joseph Redmon、Ali Farhadi(华盛顿大学)
论文标题:YOLOv3: An Incremental Improvement
发表/接收情况:仅发布于arXiv(2018年4月),从未投稿到任何学术会议
核心贡献:引入特征金字塔网络(FPN)实现多尺度检测;使用Darknet-53主干网络;采用二元交叉熵损失进行分类;在保持实时性的同时大幅提升了对小目标检测的能力。截至2026年,YOLOv3仍是YOLO系列中被引用次数最高的论文,尽管它从未“中过”任何会议。
Joseph Redmon在完成YOLOv3后宣布退出计算机视觉研究界,YOLOv3也因此成为Redmon本人参与的最后一代YOLO。
五、YOLOv4:后Redmon时代的开篇
提出团队:Alexey Bochkovskiy(最初为个人研究者)、Chien-Yao Wang、Hong-Yuan Mark Liao(台湾中央研究院)
论文标题:YOLOv4: Optimal Speed and Accuracy of Object Detection
发表/接收情况:CVPR 2020
核心贡献:在Darknet架构基础上集成了当时最有效的检测“技巧包”——CSPNet、Mish激活函数、DropBlock正则化、CmBN、Mosaic数据增强、SAT自对抗训练等,构建了系统级的工程优化框架。值得注意的是,YOLOv4并非由YOLO原作者Redmon发表,但这一工作已得到Redmon本人的认可。
六、YOLOv5:从未发表论文的“版本”
提出团队:Glenn Jocher(Ultralytics公司创始人)
论文发表情况:从未发表正式学术论文
核心贡献:YOLOv5于2020年6月以GitHub开源仓库的形式发布。其创新主要体现在工程实现层面:使用PyTorch框架(替代Darknet),引入AutoLearning bounding box anchors、Focus模块、CSPNet结构、自适应图像缩放等。
特殊争议:YOLOv5的命名曾引发争议——一些研究者认为它应该被称为“Ultralytics YOLO”而非“YOLOv5”。但无论如何命名,YOLOv5凭借其优秀的工程生态和易用性,在实际工业应用中的普及程度远超任何一代YOLO。然而从学术评价体系来看,YOLOv5没有任何一篇被正式接收的会议或期刊论文。
七、YOLOv6
提出团队:美团视觉智能部(Meituan Vision Intelligence Department)
论文标题:YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
发表/接收情况:仅发布于arXiv(尚未有明确的顶会接收记录)
核心贡献:专门针对工业场景设计,主打高精度和高推理效率。采用了EfficientRep主干网络、RepVGG风格的推理架构、Anchor-free检测头。团队获得了YOLO原作者的允许使用YOLOv6这一命名。
八、YOLOv7
提出团队:Chien-Yao Wang、Alexey Bochkovskiy、Hong-Yuan Mark Liao(台湾中央研究院与个人合作)
论文标题:YOLOv7: Trainable Bag-of-Freebies Sets New State-of-the-Art for Real-Time Object Detectors
发表/接收情况:CVPR 2023 Workshop(CVPR 2023中关于实时检测的专题研讨会)——这是一篇Workshop论文,而非CVPR主会论文。根据会议完整论文列表可查证其投稿和接收状态。
核心贡献:提出可训练的“免费礼包”集(Trainable Bag-of-Freebies),包括计划性重参数化卷积、辅助头训练策略等;设计了ELAN高效层聚合网络结构。
九、YOLOv8
提出团队:Glenn Jocher、Ayush Chaurasia、Jing Qiu(Ultralytics)
论文发表情况:YOLOv8同样从未发表正式学术论文
核心贡献:2023年1月以Ultralytics开源框架形式发布。引入了统一的YOLO框架,支持目标检测、实例分割、姿态估计、图像分类等多个任务;改进了C2f模块、无Anchor检测头。
YOLOv8目前没有正式的arXiv预印本,也没有被任何会议或期刊接收的论文——它的发布方式与YOLOv5一样,通过GitHub和文档网站进行。尽管如此,YOLOv8是目前Ultralytics生态的核心基础。
十、YOLOv9
提出团队:Chien-Yao Wang、Hong-Yuan Mark Liao(台湾中央研究院)
论文标题:YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
发表/接收情况:仅发布于arXiv(2024年2月),不是期刊论文,也不是会议论文
核心贡献:提出可编程梯度信息(PGI)和GELAN通用高效层聚合网络,旨在解决深度神经网络中的信息瓶颈问题。截至2026年6月,YOLOv9仍未被任何学术会议接收。
十一、YOLOv10
提出团队:来自清华大学的Aodong Li(一作信息)以及其他合作者(已知完整作者名单尚不完整,一作机构为清华大学)(具体团队机构待查)
论文标题:YOLOv10: Real-Time End-to-End Object Detection
发表/接收情况:NeurIPS 2024(已被接收)
核心贡献:提出了无需NMS后处理的端到端YOLO框架。通过双重分配策略(一对多分配用于训练、一对一分配用于推理)实现NMS-free设计,在保持高速度的同时提升了精度。这是首个被NeurIPS接收的YOLO系列论文。
十二、YOLOv11(Ultralytics YOLO11)
提出团队:Glenn Jocher、Ayush Chaurasia、Jing Qiu(Ultralytics)
论文发表情况:从未发表正式学术论文
核心贡献:YOLO11(Ultralytics内部不称其为“v11”)于2024年9月发布。进一步优化了C2f结构,改进了任务对齐学习,支持实例分割、姿态估计等更多任务类型。与YOLOv5和YOLOv8一样,它同样没有任何学术论文发表或接收记录。
十三、YOLOv12
提出团队:由Yunjie Tian等作者提出(一作机构为华中科技大学 & 清华大学,详细信息待查)
论文标题:YOLOv12: Attention-Centric Real-Time Object Detectors
发表/接收情况:NeurIPS 2024
核心贡献:重回“注意力中心”设计——在CNN基础上引入区域注意力机制,取代了传统YOLO一直依赖的卷积主干;保持了与CNN YOLO相当的速度,同时获得了Transformer级别的性能提升。这是第二篇被NeurIPS接收的YOLO系列论文。
十四、YOLOv13
提出团队:Mengqi Lei、Siqi Li、Yihong Wu、Han Hu、You Zhou、Xinhu Zheng、Guiguang Ding、Shaoyi Du、Zongze Wu、Yue Gao(清华大学、华中科技大学等机构合作,具体归属待查)
论文标题:YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception
发表/接收情况:仅发布于arXiv(2025年6月21日),截至当前尚未被学术会议接收
核心贡献:提出基于超图的自适应相关性增强机制(HyperACE),突破了前代模型局限于局部信息聚合和成对相关性建模的缺陷,实现了全局多对多的高阶相关性建模,提升了复杂场景下的检测性能。实验表明YOLOv13‑N相比YOLO11‑N在mAP上提升3.0%,相比YOLOv12‑N提升1.5%。
十五、YOLOv14
提出团队:南京邮电大学张晨斌团队(GitHub账号:zhangcbb)
论文发表情况:代码已开源,论文正在撰写中,尚未上传arXiv
项目地址:https://github.com/zhangcbb/yolov14
核心贡献:YOLOv14是唯一一个面向非理想成像条件的YOLO框架,旨在统一处理鱼眼畸变、游戏渲染、无人机俯视、360°全景等“非标”场景。通过自适应增强、领域自适应层、可变形区域注意力、动态尺度路由等模块,实现了跨域实时目标检测。截至2026年6月,YOLOv14的论文仍在撰写中,未提交至任何会议或期刊。
十六、YOLOvX与YOLO系列论文发表情况全景总结
16.1 各版本论文发表与接收情况汇总表
| 版本 | 提出团队 | 论文标题 | 发表/接收状态 |
|---|---|---|---|
| YOLOv1 | Joseph Redmon 等(华盛顿大学) | You Only Look Once | CVPR 2016 |
| YOLOv2 | Joseph Redmon, Ali Farhadi(华盛顿大学) | YOLO9000 | CVPR 2017(最佳论文提名) |
| YOLOv3 | Joseph Redmon, Ali Farhadi(华盛顿大学) | YOLOv3: An Incremental Improvement | 仅arXiv(2018)——未投稿 |
| YOLOv4 | Alexey Bochkovskiy 等(台湾中央研究院) | YOLOv4: Optimal Speed and Accuracy | CVPR 2020 |
| YOLOv5 | Glenn Jocher(Ultralytics) | 无正式论文 | 从未发表学术论文 |
| YOLOv6 | 美团视觉智能部 | YOLOv6: A Single-Stage Object Detection Framework… | 仅arXiv——尚未被会议接收 |
| YOLOv7 | Chien-Yao Wang 等(台湾中央研究院) | YOLOv7: Trainable Bag-of-Freebies | CVPR 2023 Workshop |
| YOLOv8 | Glenn Jocher(Ultralytics) | 无正式论文 | 从未发表学术论文 |
| YOLOv9 | Chien-Yao Wang, Hong-Yuan Mark Liao(台湾中央研究院) | YOLOv9: Learning What You Want to Learn… | 仅arXiv(2024)——未被会议接收 |
| YOLOv10 | Aodong Li 等(清华大学等) | YOLOv10: Real-Time End-to-End Object Detection | NeurIPS 2024 |
| YOLOv11 | Glenn Jocher(Ultralytics) | 无正式论文 | 从未发表学术论文 |
| YOLOv12 | Yunjie Tian 等(华中科技大学 & 清华大学) | YOLOv12: Attention-Centric… | NeurIPS 2024 |
| YOLOv13 | Lei, Li, Wu 等(清华大学,华中科技大学等) | YOLOv13: Real-Time Object Detection with Hypergraph… | 仅arXiv(2025-06-21)——未被会议接收 |
| YOLOv14 | 张晨斌团队(南京邮电大学) | 正在撰写中 | 论文尚未提交 |
16.2 关键洞察
- 只有7个版本(V1、V2、V4、V7、V10、V12、Workshop V7)发表了正式学术论文并被会议接收。其中V1、V2、V4、V7为CVPR系列;V10、V12为NeurIPS系列。
- Ultralytics路线(V5、V8、V11)从未发表任何学术论文,其影响力来源于开源社区和工程生态,而非学术发表。
- YOLOv3是学术引用最高的版本,却从未投稿到任何会议。
- NeurIPS 2024是YOLO系列首次进入NeurIPS的一年——V10和V12同时在2024年被NeurIPS接收。
- YOLOv6、YOLOv9、YOLOv13至今仍停留在arXiv,尚未被任何会议接收。
- YOLOv14是首个由国内非Top2高校实验室主导发布的版本,标志着YOLO生态从工业界开源回归学术界。
十七、YOLO系列的历史分水岭
YOLO系列的发展历程可以划分为几个清晰的阶段:
- Redmon时代(V1-V3,2015-2018):奠定YOLO基础框架,以学术会议论文为主要发布渠道。
- Ultralytics时代(V5-V8-V11,2020-2024):以工程化和开源生态为核心策略,放弃学术发表路径。
- 多元时代(V4-V6-V7-V9-V10-V12-V13-V14,2020-2026):全球多个团队和实验室各自沿YOLO路线推进,形成学术顶会、arXiv预印本、开源工程并存的复杂格局。
十八、结语
YOLO系列的发展并非一条单一的学术论文链条,而是由学术顶会论文、arXiv预印本、无论文开源工程三条路径交织而成。V1和V2是CVRP上的学术作品;V3虽无顶会认可但影响力最大;V4继承了CVPR的正统血脉;V5、V8、V11走的是工程路线;V9是纯arXiv产物;V10和V12则开创了YOLO进入NeurIPS的先河;V13目前停留在arXiv;V14则是仍在创作中的开源项目。
每一代YOLO都以自己的方式推动了目标检测领域的发展。了解了这一历史,再看到任何一个新的YOLO版本出现时,你就知道应该如何定位它了。