news 2026/2/4 16:26:22

ppo 找出口模型 训练 笔记 26/1/13

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ppo 找出口模型 训练 笔记 26/1/13

cnn模型大小我给他控制在训练耗时30s左右(4060ti)

动作空间6个:4个移动2个转头,因为一开始都要跑一遍,动作太多需要跑更多步才能吃到正反馈

我现在设置是60步一episode,5 episode训练一次

转头70度左右,前后移动控制在4s,时间模型可以调,给了模型位移程度的控制,时间设置这么长也是为了能像无头苍蝇一样先把环境用脚完全跑一遍

第3个episode就已经跑出来正反馈了(距离门很近)

这个模型我没想到的是,它训练出来,是用屁股走路的,后退当前进走到门旁边

奖励是门的面积/10000,门越大奖励越高,面积大于30w就给大奖励

早上用小碎步是能收敛的这种奖励,越训练得分越多,早上哪个架构大一点训练2分钟

yolo我还得重新训练一下近距离的情况,遇到了贴着门太大yolo没识别出来的情况

可能就是因为这样模型收敛不了

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/4 10:27:07

国产力量崛起:2026十大本土HR软件厂商深度盘点

在信息技术应用创新和供应链安全的国家战略指引下,中国人力资源软件市场正经历一场深刻的国产化替代浪潮。曾经由SAP、Oracle等国际巨头主导的HR系统市场,如今已涌现出一批技术领先、服务扎实的国产优秀厂商。这些本土企业不仅深谙中国企业管理特色&…

作者头像 李华
网站建设 2026/2/3 12:27:58

【毕业设计】基于python_CNN卷积神经网络深度学习识别花卉是否绽放

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/1/28 16:38:39

基于金融科技的客户流失行为分析预测(python jupyter notebook 机器学习 数据可视化 数据分析)(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于金融科技的客户流失行为分析预测(python jupyter notebook 机器学习 数据可视化 数据分析) 本研究基于阿里云天池1万条金融领域银行客户数据,构建模型。经清洗、描述与卡方,,,。对比Logistic、RandomFo…

作者头像 李华
网站建设 2026/1/27 8:40:41

基于python机器学习驱动的粮食产量预测项目(机器学习)(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于python机器学习驱动的粮食产量预测项目(机器学习)(设计源文件万字报告讲解)(支持资料、图片参考_相关定制) 项目内容包括: PDF报告(预测粮食产量的重要性、应用场景、方法、结果分析、改进方向&#xf…

作者头像 李华