news 2026/6/11 23:40:33

SFT后训练32B-LLM的一些观察

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
SFT后训练32B-LLM的一些观察

用单一语种数据集SFT

用COIG-CQIA数据集,以及把COIG-CQIA数据集混合guanaco和belle之后的数据集一起SFT 32B-Base模型,或者基于32B-Chat模型SFT(1-3 epoch),
目的是想提升LLM在单一语种的效果,
然后在中文通用评测集CEVAL和CMMLU评测,
效果都不如32B-Chat模型。

用一个NLP数据集SFT

用一个NLP任务的数据集(30W data),SFT 32B-Base模型,或者基于32B-Chat模型SFT(1 epoch),
目的是想把预训练的知识用到这个NLP任务里,
把SFT之后的LLM作为标注这个NLP任务训练数据的标注LLM,
效果还不如通用的32B-Chat模型作为标注LLM。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/5 13:06:05

AiPy Pro 0.12 发布,问答模式升级、智能体智能匹配

亲爱的AiPy粉丝们,AiPy Pro 0.12今天正式发布!本次更新聚焦交互优化,从智能体自动选择,到问答模式升级,让您的AI工作流更加流畅、智能、高效!感谢您一路相伴,2026年让我们与AiPy一起开启更高效的…

作者头像 李华
网站建设 2026/6/6 23:54:40

计算机毕业设计springboot大学生公寓管理系统 基于SpringBoot的高校学生宿舍智慧管理平台 采用SpringBoot框架的校园住宿一站式运营系统

计算机毕业设计springboot大学生公寓管理系统(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。 扩招之后,一栋楼动辄上千人,手工排寝、纸质报修、Excel统计…

作者头像 李华
网站建设 2026/5/31 15:59:04

sward实践教程 - 集成钉钉,使用钉钉用户扫码登录sward

集成钉钉用户功能划入社区版本,本篇文章将全面介绍如何在sward中集成钉钉用户并实现钉钉用户登录sward。1、配置钉钉进入系统设置->用户->用户目录,点击钉钉后的配置按钮,填写钉钉的配置信息。属性说明企业ID在钉钉管理后台中创建应用&…

作者头像 李华
网站建设 2026/6/9 0:18:02

如何将视频从 iPhone 传输到戴尔笔记本电脑?

您的 iPhone 可以拍摄精彩的视频,但这些视频片段很快就会占满您的存储空间。与其担心空间不足,不如将它们转移到您的戴尔笔记本电脑上?这样,您既可以释放手机空间,又可以安全地备份您珍爱的瞬间。在本指南中&#xff0…

作者头像 李华
网站建设 2026/6/6 9:37:57

计算机毕业设计springboot大科院竞赛管理系统 基于SpringBoot的学科竞赛全流程数字化管理平台 融合SpringBoot与Vue的高校科研竞赛一站式运营系统

计算机毕业设计springboot大科院竞赛管理系统(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。科研竞赛已成为高校培养创新人才的核心场景,每年校级、省级、国家级赛事…

作者头像 李华