news 2026/5/27 1:34:50

我读Population Based Training of Neural Networks

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
我读Population Based Training of Neural Networks

原文点此

1.intro

PBT是一种简单的异步优化算法,它能够有效利用固定的计算预算,通过联合优化一组模型和其超参数以最大化性能。

2.methodology

目标是优化模型f ff的参数θ \thetaθ以最大化目标函数Q ^ \hat {\mathcal{Q}}Q^, 实际性能指标Q \mathcal{Q}Q通常有别于Q ^ \hat{\mathcal{Q}}Q^。PBT的目的是在Q \mathcal{Q}Q上联合优化参数θ \thetaθ和超参数h hh, 寻找最优参数集的过程可以表述为:θ ∗ = argmax θ ∈ Θ eval ( θ ) \theta^*=\text{argmax}_{\theta\in\Theta}\text{eval}(\theta)θ=argmaxθΘeval(θ)

具体来说,θ ← step ( θ ∣ h ) \theta\leftarrow \text{step}(\theta|h)θstep(θh),θ ∗ = optimize ( θ ∣ h ) = optimize ( θ ∣ ( h t ) t = 1 T ) = step ( step ( … step ( θ ∣ h 1 ) … ∣ h T − 1 ) ∣ h T ) \theta^*=\text{optimize}(\theta|h)=\text{optimize}(\theta|(h_t)^T_{t=1})=\text{step}(\text{step}(\dots\text{step}(\theta|h_1)\dots|h_{T-1})|h_T)θ=optimize(θh)=optimize(θ(ht)t=1T)=step(step(step(θh1)hT1)hT), 这样的迭代过程计算成本很高且算得慢;受超参数h hh的影响也很大, 需要有关h hh的先验知识。

一个省事而且快的算式是θ ∗ = optimize ( θ ∣ h ∗ ) \theta^*=\text{optimize}(\theta|h^*)θ=optimize(θh),h ∗ = argmax h ∈ H T eval ( optimize ( θ ∣ H ) ) h^*=\text{argmax}_{h\in\mathcal{H}^T}\text{eval}(\text{optimize}(\theta|H))h=argmaxhHTeval(optimize(θH))

用这个算式训练N NN个模型{ θ i } i = 1 N \{\theta^i\}^N_{i=1}{θi}i=1N组成种群P \mathcal{P}P, 每个个体用不同的超参数{ h i } i = 1 N \{h^i\}^N_{i=1}{hi}i=1N优化, 目标是找到整个种群中的最优模型。

instead of采用并行搜索(每个个体各自独立地找最优解), PBT使用部分已有的解进行额外的meta-optimization, 即根据整个种群的表现调整超参数h hh和权重θ \thetaθ。实现方式:

(1) exploit, 根据种群的表现决定worker是否放弃当前解并专注于更promising的

(2) explore, 在给定当前解和超参数的条件下提出新解以更好地搜索解空间

种群中的每个个体并行训练, 当其被认为准备就绪(如优化步数达标或达到特定性能阈值)时, 其权重和超参数由exploit和explore更新(比如exploit把当前权重替换成种群中表现最优者的权重, explore用噪声随机扰动超参数)。在exploit和explore之后, 继续迭代更新。重复这样的过程直到模型收敛。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/22 7:53:37

union 和 union all的区别

1、union和union all UNION对两个结果集进行并集操作,不包括重复行,相当于使用distinct关键字。而UNION ALL则对两个结果集进行并集操作,包括重复行,即所有结果全部显示,不管是否重复。 UNION操作会去除重复的记录&…

作者头像 李华
网站建设 2026/5/21 10:32:58

爱心公益 PPT 一键生成平台 TOP6,无需设计基础也能做

6款好用工具推荐,新手也能搞定爱心公益PPT一键生成 作为经常帮公益组织和校园社团做PPT的过来人,我太懂新手做爱心公益PPT的痛点了:找模板耗半天、排版没思路、素材怕侵权,最后熬夜做出来的效果还不尽如人意。其实现在有很多实用工…

作者头像 李华
网站建设 2026/5/23 3:28:52

中小企业必看!RFID资产管理系统,不用大投入也能高效管资产

跟不少中小企业老板和运维聊过,发现大家对资产管理都有个矛盾心理:想做好管理,又怕投入太多成本,最后得不偿失;放任不管,又总被资产混乱、盘点耗时、流失浪费等问题拖后腿。尤其是对于人员精简、预算有限的…

作者头像 李华
网站建设 2026/5/20 11:00:14

互联网大厂Java面试场景:从Spring到微服务的技术探讨

互联网大厂Java面试场景:从Spring到微服务的技术探讨 场景:互联网大厂面试现场 面试官是一位经验丰富的技术专家,而求职者“超好吃”则是一位刚刚准备进入互联网大厂的Java小白程序员。面试官开始了严肃而循序渐进的面试。 第一轮提问&…

作者头像 李华
网站建设 2026/5/22 18:43:50

智能体持久性记忆实战:从0到1构建双路记忆堆栈

本文介绍如何为智能体构建持久性记忆系统,通过双路记忆堆栈(情节记忆语义记忆)解决智能体健忘问题。情节记忆使用向量数据库存储对话历史,语义记忆使用图数据库存储结构化事实。文章详细展示了实现方法、代码构建及实际应用&#…

作者头像 李华