day49-平芜编程栈

@浙大疏锦行

1. 预训练的概念
核心定义：先在大规模通用数据集上训练一个基础模型（学习通用特征，如边缘、纹理、形状），再将这个模型的参数迁移到目标任务中，进行微调（Fine-tuning）或直接使用。
本质：利用 “通用数据的特征迁移”，解决目标任务数据量少、训练成本高的问题，是迁移学习的核心方式之一。
作用：大幅降低目标任务的训练时间；提升小数据集任务的模型性能；避免从零训练模型的过拟合风险。

2.经典的预训练模型

3.预训练的策略
（1）冻结预训练层（仅微调头部）：
操作：冻结预训练模型的大部分层（仅保留参数不更新），只修改模型的 “分类头”，仅训练分类头。
适用场景：目标任务数据量少、预训练模型特征足够通用。
（2）全量微调（Fine-tuning）：
操作：解冻预训练模型的部分 / 全部层，让所有层的参数随目标任务更新。
适用场景：目标任务数据量充足，需要模型适配任务的专属特征。
（3）特征提取（Feature Extraction）：
操作：直接用预训练模型的输出作为目标任务的特征，不更新预训练模型参数，仅训练新的分类器。
适用场景：目标任务与预训练任务高度相似，预训练特征可直接复用。

用预训练 ResNet18 完成 CIFAR10 分类

在CIFAR10 对比不同预训练模型（以 MobileNetV2 为例）

Qwen2.5-7B镜像部署推荐：开箱即用，免环境配置快速上手

Qwen2.5-7B镜像部署推荐：开箱即用，免环境配置快速上手 1. 背景与技术价值随着大语言模型在实际业务场景中的广泛应用，如何高效、低成本地部署高性能模型成为开发者和企业的核心关注点。阿里云推出的 Qwen2.5-7B 作为最新一代开源大语言模型…

李华

Qwen2.5-7B模型评估：量化性能指标

Qwen2.5-7B模型评估：量化性能指标 1. 引言：为何需要深入评估Qwen2.5-7B？ 随着大语言模型（LLM）在实际业务场景中的广泛应用，模型选型不再仅依赖“参数规模”这一单一维度。阿里云最新发布的 Qwen2.5-7B 模型…

李华

QTabWidget高亮当前活动页：通俗解释实现逻辑

让 QTabWidget 当前页“亮”起来：从原理到实战的完整实现指南你有没有遇到过这样的情况？在调试一个复杂的嵌入式系统界面时，页面太多、标签太密，一不小心就点错了功能模块。或者用户反馈：“我根本不知道现在在哪一页&a…

李华

SerialPort数据帧解析：图解说明工业报文结构

串口通信实战：一文搞懂工业数据帧的解析艺术你有没有遇到过这样的情况？明明代码写得没问题，串口也打开了，可收到的数据却总是“对不上号”——有时少几个字节，有时多一堆乱码。更离谱的是，同样的设备换条线…

李华

scanner与二维码识别对比：通俗解释差异与选择

扫码枪 vs 二维码识别：别再傻傻分不清，一文讲透技术本质与选型逻辑你有没有遇到过这种情况？在超市收银台，收银员“嘀”一下就扫完一件商品，动作快得像闪电；而你自己打开手机付款码，却要等好几秒…

李华

circuit simulator联合仿真中的时序与噪声协同分析方法

用电路仿真器做联合仿真：真正看清时序与噪声的“蝴蝶效应”你有没有遇到过这种情况？静态时序分析（STA）显示一切正常，电源完整性报告也绿灯通行，但芯片一上电就频繁误触发——尤其是在高负载或温度变化时。这…

李华