今天我们来进行一个全流程的免费白嫖方式的模型微调训练实战,相信很多小伙伴看到免费白嫖的字眼已经蠢蠢欲动准备要尝试一番了,来吧,让我助你一臂之力。
首先,在开始之前,我们先简单补补课,了解一下预训练和微调的基础背景知识(由 Claude 提供),当然学霸请直接跳过。
训练 vs 微调的关系
训练(Training)├── 预训练(Pre-training) ← 从零开始训练└── 微调(Fine-tuning) ← 在预训练模型基础上继续训练详细区别
预训练(Pre-training)
- •从零开始训练模型
- • 使用海量数据(TB 级别)
- • 需要巨大算力(数千个 GPU,数月时间)
- •成本极高(数百万到数千万美元)
- • 学习通用语言知识
例子: OpenAI 训练 GPT-4, Anthropic 训练 Claude
微调(Fine-tuning)
- •基于已训练好的模型继续训练
- • 使用少量特定数据(几百到几万条)
- • 只需普通算力(单卡或几张 GPU,几小时)
- •成本较低(几十到几百美元)
- • 学习特定任务或领域知识
例子: 接下来在 LLaMA Factory 中做的事情
OK,热身完毕,实战正式开始!
环境准备
第一步:白嫖高配 GPU 算力
- • 登录魔搭社区 https://modelscope.cn/my/mynotebook,绑定阿里云账号,点击我的 Notebook。如下图所示,可以看到方式二中提供的免费 36 小时 GPU 实例环境,直接点击启动。
- • 启动成功后,点击查看 Notebook。
- • 进入机器终端主界面。
- • 点击终端进入命令行。
安装 LLaMA Factory 开源框架
git clone https://github.com/hiyouga/LLaMA-Factory.gitcd LLaMA-Factory#创建虚拟环境python -m venv .venv#激活虚拟环境source .venv/bin/activate# 安装依赖pip install -e ".[torch,metrics]"# 环境冲突用这个解决 `pip install --no-deps -e .` ``` 这一步需要安装大量依赖(包括很多 NVIDIA 组件),速度可能会比较慢,请耐心等待。  安装成功!  数据集准备 ===== 数据集下载和清洗 -------- ```plaintext https://www.modelscope.cn/datasets/lvjianjin/AdvertiseGen ``` 下载 `train.csv`,为了演示效率,建议只保留前 5000 行(否则训练时间会非常感人)。然后通过脚本将其转换为 `json` 格式,生成文件 `advertise.json`。```plaintext import csvimport jsonfrom pathlib import Pathdef csv_to_advertise_json(csv_path: str = "train.csv", json_path: str = "advertise.json") -> None: """ 将 train.csv 转换为 advertise.json 字段映射: content -> input summary -> output """ data = [] try: with open(csv_path, newline='', encoding='utf-8') as f: reader = csv.DictReader(f) for row in reader: data.append({ "instruction": "根据下面的关键词写一个广告文案", "input": row.get("content", "").strip(), "output": row.get("summary", "").strip() }) with open(json_path, 'w', encoding='utf-8') as f: json.dump(data, f, ensure_ascii=False, indent=2) print(f"✅ 转换完成,共 {len(data)} 条记录,已保存至 {Path(json_path).absolute()}") except FileNotFoundError: print(f"❌ 未找到文件:{csv_path}") except Exception as e: print(f"❌ 处理失败:{e}")if __name__ == "__main__": csv_to_advertise_json() ```转换后文件内容和格式如下:  将本地 Python 脚本生成的 `advertise.json` 拖拽到 **模型根目录/data** 文件夹中,并且修改默认训练数据集配置文件——`dataset_info.json`。  把刚才生成的需要微调的训练数据文件标识和文件名添加到 `dataset_info.json` 中。  数据准备就绪后,在终端输入以下命令启动 WebUI: ```plaintext export USE_MODELSCOPE_HUB=1llamafactory-cli webui开始微调训练
微调选项设置
点击输出的链接,进入 LLaMA Factory 的 Web 界面。
在界面中进行如下设置:模型一定要选择后缀为instruct的版本(base后缀指的是原始的预训练大模型,instruct指的是基于原始的预训练大模型做过指令微调的,更适合我们的任务)。下面勾选刚才准备的训练数据集,其他基本设置保持默认。点击最下面的“开始训练”,然后就可以去喝杯咖啡了,大概需要 30 分钟左右。
开始训练
回到终端界面,你会看到训练进度条正在缓慢蠕动。
⚠️ 切记:这一步比较慢,同时魔搭的免费实例如果超过 1 小时无操作会自动关闭(别问我怎么知道的,血泪教训),一定记得偶尔回来动动鼠标,保持活跃。
训练完成
经过漫长的等待(我这里大概用了将近 1 个小时),终于微调成功!
回到 LLaMA Factory Web 界面,可以看到检查点路径下已经有了微调后的模型。
导出模型
微调完成后,我们就可以导出模型了。按照之前的教程将模型转换为 GGUF 格式,然后下载到本地,就可以导入到 Ollama 或 Jan 中使用了,享受自己亲手调教的专属模型!
总结与展望
至此,我们已经成功完成了一次从环境搭建、数据准备到模型微调的全流程实战,而且最重要的是——全程免费,纯靠白嫖!
通过这次实战,你不仅掌握了 LLaMA Factory 这一强大的微调神器,更验证了“穷搞 AI”的可行性。虽然我们用的是免费算力,但跑通流程的经验是无价的。
接下来,你可以尝试更换不同的数据集,或者调整超参数,看看模型会有什么样有趣的变化。
想入门 AI 大模型却找不到清晰方向?备考大厂 AI 岗还在四处搜集零散资料?别再浪费时间啦!2025 年AI 大模型全套学习资料已整理完毕,从学习路线到面试真题,从工具教程到行业报告,一站式覆盖你的所有需求,现在全部免费分享!
👇👇扫码免费领取全部内容👇👇
一、学习必备:100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT,帮你看透 AI 趋势
想了解大模型的行业动态、商业落地案例?大模型电子书?这份资料帮你站在 “行业高度” 学 AI:
1. 100+本大模型方向电子书
2. 26 份行业研究报告:覆盖多领域实践与趋势
报告包含阿里、DeepSeek 等权威机构发布的核心内容,涵盖:
- 职业趋势:《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》;
- 商业落地:《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》;
- 领域细分:《AGI 在金融领域的应用报告》《AI GC 实践案例集》;
- 行业监测:《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。
3. 600+套技术大会 PPT:听行业大咖讲实战
PPT 整理自 2024-2025 年热门技术大会,包含百度、腾讯、字节等企业的一线实践:
- 安全方向:《端侧大模型的安全建设》《大模型驱动安全升级(腾讯代码安全实践)》;
- 产品与创新:《大模型产品如何创新与创收》《AI 时代的新范式:构建 AI 产品》;
- 多模态与 Agent:《Step-Video 开源模型(视频生成进展)》《Agentic RAG 的现在与未来》;
- 工程落地:《从原型到生产:AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。
二、求职必看:大厂 AI 岗面试 “弹药库”,300 + 真题 + 107 道面经直接抱走
想冲字节、腾讯、阿里、蔚来等大厂 AI 岗?这份面试资料帮你提前 “押题”,拒绝临场慌!
1. 107 道大厂面经:覆盖 Prompt、RAG、大模型应用工程师等热门岗位
面经整理自 2021-2025 年真实面试场景,包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题,每道题都附带思路解析:
2. 102 道 AI 大模型真题:直击大模型核心考点
针对大模型专属考题,从概念到实践全面覆盖,帮你理清底层逻辑:
3. 97 道 LLMs 真题:聚焦大型语言模型高频问题
专门拆解 LLMs 的核心痛点与解决方案,比如让很多人头疼的 “复读机问题”:
![]()
三、路线必明: AI 大模型学习路线图,1 张图理清核心内容
刚接触 AI 大模型,不知道该从哪学起?这份「AI大模型 学习路线图」直接帮你划重点,不用再盲目摸索!
路线图涵盖 5 大核心板块,从基础到进阶层层递进:一步步带你从入门到进阶,从理论到实战。
L1阶段:启航篇丨极速破界AI新时代
L1阶段:了解大模型的基础知识,以及大模型在各个行业的应用和分析,学习理解大模型的核心原理、关键技术以及大模型应用场景。
L2阶段:攻坚篇丨RAG开发实战工坊
L2阶段:AI大模型RAG应用开发工程,主要学习RAG检索增强生成:包括Naive RAG、Advanced-RAG以及RAG性能评估,还有GraphRAG在内的多个RAG热门项目的分析。
L3阶段:跃迁篇丨Agent智能体架构设计
L3阶段:大模型Agent应用架构进阶实现,主要学习LangChain、 LIamaIndex框架,也会学习到AutoGPT、 MetaGPT等多Agent系统,打造Agent智能体。
L4阶段:精进篇丨模型微调与私有化部署
L4阶段:大模型的微调和私有化部署,更加深入的探讨Transformer架构,学习大模型的微调技术,利用DeepSpeed、Lamam Factory等工具快速进行模型微调,并通过Ollama、vLLM等推理部署框架,实现模型的快速部署。
L5阶段:专题集丨特训篇 【录播课】
![]()
四、资料领取:全套内容免费抱走,学 AI 不用再找第二份
不管你是 0 基础想入门 AI 大模型,还是有基础想冲刺大厂、了解行业趋势,这份资料都能满足你!
现在只需按照提示操作,就能免费领取:
👇👇扫码免费领取全部内容👇👇
2025 年想抓住 AI 大模型的风口?别犹豫,这份免费资料就是你的 “起跑线”!