news 2026/4/25 9:14:09

AI基础入门(模型微调)——创建一个属于自己的大模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AI基础入门(模型微调)——创建一个属于自己的大模型

目录

    • 一、什么是模型微调
    • 二、怎样微调模型
    • 三、使用 LLaMa Factory 微调模型
    • 四、在 Ollama 中运行微调模型

本文来源:极客时间vip课程笔记

一、什么是模型微调

  • 模型微调,顾名思义,就是对模型微微做一些调整。为什么要做微调呢?如果可以的话,每个公司都想拥有一个属于自己的大模型。但是,现实比较残酷,训练一个大模型需要花太多的钱。按照一些大公司的说法,一个千亿参数的大模型,训练一次的成本大约需要几百万美元。这显然就超过一个普通公司承受的范围。虽然我们无法训练一个属于自己的大模型,但一个好消息是,我们可以做模型微调。
  • 大模型是构建于神经网络基础之上的,神经网络可以理解成一个一个的神经元构建的网络训练模型,就是在调整神经元之间的连接方式。一次完整的训练就相当于把所有的神经元连接都调整一遍,这个计算规模相当之大,是我们无法承受的。
  • 所谓微调,就是把一个训练好的模型中的一部分连接重新调整。因为只做了一部分的调整,所以,规模就要小得多,训练成本也就要小得多。
  • 前面说过,RAG 和模型微调可以解决同样的问题,从本质上说,就是把核心业务数据放在提示词里,还是放在模型里。
  • 两种做法各有优劣。放到提示词里,优势就是做法比较简单,但其问题的关键在于能否取到恰当的数据。如果不能取到恰当的数据,就可能会出现“幻觉”问题,也就是大模型会一本正经地胡说八道。放到模型里,优势是数据准确性会提高,但前提条件是在训练的时候,要准备高质量的数据,否则就是“垃圾进,垃圾出”了,而微调好一个模型,并不是一件很容易的事情。
  • 在工程实践中,二者往往是结合使用的。模型微调不是时刻在进行,所以,一些团队的做法是,用 RAG 的方式提取新的业务数据,积累到一定阶段,用这些数据进行模型微调,把这些数据内置到模型中,再把新模型替换到业务系统中。这样一来,既保证数据的新鲜,又保证了基本的服务质量。

二、怎样微调模型

  • 模型微调,需要我们先选定一个模型。如果选定的模型是像 OpenAI 这样的闭源模型,就需要使用其对应的模型微调服务。不过,使用这种服务也就意味着要把数据提供出去。所以,很多团队的实际做法是,基于开源模型的微调。

  • 具体的模型微调通常分成几个步骤:

    准备训练数据

    训练模型

    评估结果

    使用模型

  • 这其中最耗时耗力的,应该是准备数据了。首先,微调大模型需要多准备一些数据,数据量过少,可能看上去完全不起作用。毕竟大模型那么多参数,如果只改动几个,占比太低,就和没改动效果差不多。其次,数据也要精心挑选一下,还是那句话:垃圾进,垃圾出。所以,这个过程不是技术活,而是一个体力活。什么数据是好数据?最好由一个懂业务的人说了算。

  • 顺便说一下,因为准备数据耗时耗力,有人把一些整理好的数据开源了出来,Hugging Face 上有大量这种数据集。如果站在学习的角度,我们可以把这些数据集拿过来直接用。

  • 我们知道了要准备数据,但数据格式是什么样的呢?这取决于模型微调的具体方式,比如,OpenAI 的模型微调需要把数据准备成下面这样:

    {"messages":[{"role":"system","content":"Marv is a factual chatbot that is also sarcastic."},{"role":"user","content":"What's the capital of France?"},{"role":"assistant","content":"Paris, as if everyone doe
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/25 8:37:19

HunyuanVideo-Foley模型开源:大幅提升视频后期制作效率

HunyuanVideo-Foley模型开源:大幅提升视频后期制作效率 在短视频日均产量突破千万条的今天,内容创作者正面临一个隐性瓶颈——音效。画面可以快速剪辑、滤镜一键套用,但脚步声是否踩在雨后石板上、门轴转动是否有年久失修的吱呀声&#xff0c…

作者头像 李华
网站建设 2026/4/24 9:56:42

火山引擎AI大模型生态中Qwen3-VL-8B的应用定位

火山引擎AI大模型生态中Qwen3-VL-8B的应用定位 在电商客服对话框里上传一张商品图,系统立刻识别出“这是一款复古风高腰牛仔阔腿裤,搭配白色条纹衬衫适合通勤穿搭”;在内容审核后台,一张看似正常的风景照配上敏感文字,…

作者头像 李华
网站建设 2026/4/21 19:10:00

Linux动态壁纸终极指南:7个简单技巧打造惊艳桌面

Linux动态壁纸终极指南:7个简单技巧打造惊艳桌面 【免费下载链接】linux-wallpaperengine Wallpaper Engine backgrounds for Linux! 项目地址: https://gitcode.com/gh_mirrors/li/linux-wallpaperengine 厌倦了单调的静态壁纸?想在Linux系统上体…

作者头像 李华
网站建设 2026/4/23 13:47:51

深度解析Qwen3-VL-30B:300亿参数背后的视觉语言黑科技

深度解析Qwen3-VL-30B:300亿参数背后的视觉语言黑科技 在自动驾驶系统需要实时判断“前方施工围挡是否影响变道”、医生希望AI能直接从X光片中指出病灶区域并推测病因、电商平台用户上传一张北欧风装修图却期望推荐风格一致的沙发时——我们早已超越了对图像分类或文…

作者头像 李华
网站建设 2026/4/19 12:40:01

ComfyUI-Manager终极指南:一站式AI绘画插件管理平台

ComfyUI-Manager是专为ComfyUI设计的智能管理工具,彻底革新了传统手动安装插件的繁琐流程,让插件安装、更新和配置变得前所未有的简单高效。无论你是AI绘画爱好者还是专业创作者,这个工具都能显著提升你的工作效率,让技术门槛不再…

作者头像 李华
网站建设 2026/4/16 14:08:09

为什么Wan2.2-T2V-5B是社交媒体内容创作者的新利器?

Wan2.2-T2V-5B:如何让每个创作者都拥有“AI导演”? 在抖音、Instagram Reels 和 YouTube Shorts 每天吞吐数亿条短视频的今天,内容创作者面临的不再是“有没有创意”的问题,而是“能不能跟上节奏”。一条爆款视频可能带来百万流量…

作者头像 李华