news 2026/4/25 13:05:01

some 知识点 knowledge

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
some 知识点 knowledge

输出 查看模型结构 使用print(model) model.name_module() model.named_parameters()等方式查看层级结构

对于vit reanet yolox等常见架构 结合官方文档和源吗

确定可冻结/可训练的模块 在vit中 可以冻结 patch_embed 和前几层blocks 只微调后面几层+分类头

通过requires_grad控制梯度更新 冻结backbone 解冻特定层

微调的时候 不同模块用不同的学习率

还有的是在不同的epoch使用不同的学习率

学习率调度知识点:

按epoch变化 step decay 阶梯衰减 每隔固定epoch 学习率*一个衰减因子

多阶段衰减,在预设的epoch节点 衰减

linear warmup_decay 线性预热+衰减 前几个epoch线性增加 learning rate 之后按照step/cosine衰减

啥是cosine decay?余弦衰减 学习率就像余弦的图像一样衰减下来

关于早停机制、保存最佳模型、最终模型是否最优

在深度学习训练中,训练loss会持续下降,但是验证指标(比如准确率 mAp f1 )往往会线上升后下降 这就是过拟合

F1的计算就是:

不能只是保存最后的checkpoint 而是要监控验证指标,保存历史最佳

最好的标准是自己决定的:你所关心的指标达到最优就是 最好

早停机制 :当模型在验证集上不再变好时,提前终止训练, 在每个epoch 或者是n个step 在验证集上评估指标 如果连续 m个epoch没有提升,就停止训练

让我想起了一个叫做优化器的东西。

optimizer = torch.optim.AdamW(
model.parameters(),#model.parameters这些参数是需要被更新的
lr=5e-5,#学习率
weight_decay=0.05,#衰减
betas=(0.9, 0.98) # ViT 常用 beta1=0.9 当前梯度占0.1 过去梯度占0.9 beta2=0.98梯度平方的平滑,控制步长缩放,防止某些参数更新太猛

scheduler = get_cosine_schedule_with_warmup(
optimizer,
num_warmup_steps=500,#学习率这样持续500个step 注意step和epoch的区别 训练一次就能看出来了 epoch是多个step
num_training_steps=total_steps
)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 2:02:35

揭秘Laravel 13全新API文档系统:如何一键生成多模态交互式文档

第一章:Laravel 13 的多模态 API 文档生成 Laravel 13 引入了对多模态 API 文档生成的原生支持,开发者可通过集成 OpenAPI 规范与 AI 驱动的注解解析器,自动生成交互式文档、代码示例及可视化请求流程图。该功能基于新的 apiResource 注解语…

作者头像 李华
网站建设 2026/4/23 12:44:08

扩展加载失败频发?,PHP 8.6依赖治理全链路解决方案来了

第一章:PHP 8.6扩展依赖管理的挑战与演进随着 PHP 生态系统的持续扩张,扩展模块之间的依赖关系日益复杂。PHP 8.6 虽未引入全新的依赖管理器,但在扩展加载机制和版本兼容性校验方面进行了关键优化,以应对多扩展协同工作时的冲突与…

作者头像 李华
网站建设 2026/4/25 15:08:26

【PHP扩展进阶必看】:5大关键API让你秒懂8.6扩展架构

第一章:PHP 8.6 扩展架构概览 PHP 8.6 的扩展架构在保持向后兼容的同时,进一步优化了模块化设计与性能表现。核心引擎 Zend 引擎的增强使得扩展开发更加高效,同时引入了更严格的类型检查和内存管理机制,提升了运行时稳定性。 扩展…

作者头像 李华
网站建设 2026/4/25 0:46:22

医院数字产科管理平台,数字产科源码,覆盖了孕妇从怀孕开始到生产结束以及产后42天以内的一系列医院保健服务信息

数字产科管理平台是为医院产科量身定制的信息管理系统,旨在提高医院产科的服务质量和管理效率。该平台全面覆盖了孕妇从怀孕开始到生产结束以及产后42天以内的一系列医院保健服务信息。以下是数字产科管理平台的详细介绍:一、系统组成数字产科管理平台主…

作者头像 李华
网站建设 2026/4/25 2:48:22

如何用Symfony 8实现零宕机微服务通信?一线架构师的5点建议

第一章:Symfony 8 微服务通信的零宕机挑战在构建高可用的微服务架构时,Symfony 8 提供了强大的组件支持,如 Messenger 组件和 HTTP Client,使得服务间通信更加灵活。然而,在实际部署中,如何实现服务更新期间…

作者头像 李华