【2026】 LLM 大模型系统学习指南 (44)-平芜编程栈

都是 AI 的作文比赛 —— 提示词工程与 AI 写作优化实战

“AI 的作文比赛” 不是单纯让 AI 生成作文，而是以 “作文创作” 为场景，聚焦提示词工程、AI 生成优化、作文质量评估三大核心能力。通过让 AI 围绕指定主题生成高质量作文，再通过人工优化提示词、对比不同模型效果、建立评估标准，最终理解 “如何让 AI 精准匹配创作需求”，同时深化对生成式 AI 逻辑的理解 —— 这既是对提示词设计能力的训练，也是对 AI 生成内容质量把控能力的提升。

作业以高中常见作文主题为载体（如 “科技与生活”“青春成长”），兼顾 “技术实操” 与 “文学创作逻辑”，让不同基础的学习者都能在实战中掌握 AI 写作的核心方法。

一、作业核心目标

技术目标：掌握 AI 写作的提示词设计逻辑，能通过精准指令引导 AI 生成符合主题、结构完整、语言流畅的作文；
能力目标：学会对比不同 LLM 的写作风格，能通过迭代优化提示词解决 AI 作文的 “空洞、跑题、缺乏逻辑” 等问题；
思维目标：建立 “需求→提示词→生成→评估→优化” 的闭环思维，理解 “AI 是创作工具，人是核心决策者” 的协同逻辑。

二、核心任务拆解：从 “写作文” 到 “会用 AI 写好作文”

作业按 “基础→进阶→综合” 递进，所有任务围绕 “同一作文主题” 展开（推荐主题：高中议论文《科技发展与人文温度》），确保训练的连贯性：

1. 必做任务 1：基础提示词设计 —— 让 AI 生成合格作文

任务目标：

设计基础提示词，让 AI 生成一篇符合高中议论文要求的作文（800 字左右，结构完整：开头点题→分论点论证→结尾升华），避免跑题、结构混乱。

核心思路：

AI 写作的核心是 “提示词给 AI 明确的‘创作规则’”，基础提示词需包含 5 个关键要素：主题、文体、结构、字数、语言风格，缺一不可。

提示词设计模板（可直接复用）：

plaintext

### 作文要求： 1. 主题：《科技发展与人文温度》（议论文）； 2. 文体：高中议论文，符合高考作文评分标准（论点明确、论据充分、逻辑清晰）； 3. 结构：开头点题（引出科技与人文的关系）→ 2-3个分论点（每个分论点配具体论据，如案例、名言）→ 结尾升华（联系青年责任）； 4. 字数：800字左右（±50字）； 5. 语言风格：正式、流畅，避免口语化，适当使用修辞手法（比喻、排比），引用1-2句名言警句； 6. 论据要求：论据真实可信（如具体科技案例、历史人物事迹），避免虚构。 ### 输出： 完整的800字议论文，分段落呈现（开头、每个分论点、结尾各为一段）。

实操代码（用 Llama 3 生成作文）：

python

运行

# 安装依赖 # pip install transformers torch from transformers import AutoTokenizer, AutoModelForCausalLM # 加载模型（轻量级，适合作文生成） model_name = "meta-llama/Llama-3.2-8B-Instruct" tokenizer = AutoTokenizer.from_pretrained(model_name) tokenizer.pad_token = tokenizer.eos_token model = AutoModelForCausalLM.from_pretrained( model_name, torch_dtype=torch.float16, device_map="auto", load_in_8bit=True # 8bit量化，节省显存 ) # 输入提示词（替换为上面的作文要求） prompt = """### 作文要求： 1. 主题：《科技发展与人文温度》（议论文）； 2. 文体：高中议论文，符合高考作文评分标准（论点明确、论据充分、逻辑清晰）； 3. 结构：开头点题（引出科技与人文的关系）→ 2-3个分论点（每个分论点配具体论据，如案例、名言）→ 结尾升华（联系青年责任）； 4. 字数：800字左右（±50字）； 5. 语言风格：正式、流畅，避免口语化，适当使用修辞手法（比喻、排比），引用1-2句名言警句； 6. 论据要求：论据真实可信（如具体科技案例、历史人物事迹），避免虚构。 ### 输出： 完整的800字议论文，分段落呈现（开头、每个分论点、结尾各为一段）。""" # 生成作文 inputs = tokenizer( prompt, return_tensors="pt", truncation=True, max_length=1024 ).to(model.device) with torch.no_grad(): outputs = model.generate( **inputs, max_new_tokens=1000, # 预留足够长度生成800字作文 temperature=0.4, # 降低随机性，保证逻辑连贯 top_p=0.9, repetition_penalty=1.2 # 避免重复语句 ) # 解码并保存作文 essay = tokenizer.decode(outputs[0], skip_special_tokens=True).split("### 输出：")[-1].strip() print("AI生成的作文：") print(essay) # 保存到文件 with open("ai_essay_basic.txt", "w", encoding="utf-8") as f: f.write(essay)

任务交付要求：

提交生成的作文文本（标注 “基础提示词版”）；
附 100 字分析：说明作文是否符合要求（主题、结构、字数、论据），存在哪些问题（如分论点不清晰、论据不具体）。

2. 必做任务 2：提示词优化 —— 让 AI 生成优质作文

任务目标：

针对基础版作文的问题，优化提示词，让 AI 生成 “高分作文”（论点更深刻、论据更具体、语言更生动），解决 “空洞、论据不足、逻辑松散” 等问题。

核心优化思路：

在基础提示词的基础上，增加细节约束和示例引导，让 AI 更明确 “优质作文的标准”：

细化分论点方向（如 “科技发展需以人文为根基”“人文温度让科技更有价值”）；
指定论据类型（如 “近期科技案例”“名人名言”“社会现象”）；
加入语言细节要求（如 “每个分论点开头用排比句引领”“结尾联系新时代青年使命”）。

优化后的提示词模板：

plaintext

### 作文要求： 1. 主题：《科技发展与人文温度》（议论文）； 2. 文体：高中高分议论文（符合高考一类文标准）； 3. 结构： - 开头（100字）：用比喻修辞点题（如“科技是船，人文是帆”），引出核心论点“科技发展与人文温度相辅相成，缺一不可”； - 分论点1（200字）：科技发展需以人文为根基（论据：ChatGPT的伦理规范、某科技公司“老人友好型产品”案例）； - 分论点2（200字）：人文温度让科技更有价值（论据：袁隆平杂交水稻技术的人文关怀、医疗AI辅助偏远地区诊断的案例）； - 分论点3（200字）：青年当兼顾科技创新与人文素养（论据：95后工程师研发无障碍科技产品的事迹）； - 结尾（100字）：升华主题，引用名言（如“科技是第一生产力，而人文是科技的灵魂”），联系青年责任。 4. 字数：800字左右（±50字）； 5. 语言风格：正式流畅，多用排比、比喻修辞，分论点开头用“科技为翼，人文为根”“人文为魂，科技为器”等对仗句式； 6. 论据要求：论据为近3年的真实案例（如2023-2025年的科技事件），避免陈旧案例（如爱迪生发明电灯）。 ### 输出： 完整的800字议论文，分段落呈现，标注每个部分（开头、分论点1-3、结尾）。

实操与对比：

用优化后的提示词重新生成作文（标注 “优化提示词版”）；
对比基础版和优化版的差异，重点分析：分论点是否更清晰、论据是否更具体、语言是否更生动。

任务交付要求：

提交优化版作文文本；
提交 “对比分析表”（如下表）：

评估维度	基础版作文	优化版作文	优化原因
分论点清晰度	模糊，无明确逻辑关联	明确，呈 “根基→价值→责任” 递进	提示词指定了分论点方向
论据具体性	论据陈旧（如爱因斯坦案例）	论据新颖（近 3 年科技案例）	提示词限定了论据时间范围
语言生动性	平淡，无修辞	多用排比、比喻，句式对仗	提示词明确了修辞要求
结构完整性	结尾未升华	结尾联系青年责任，升华主题	提示词指定了结尾要求

3. 进阶任务 3：多模型对比 —— 选最优 AI “笔友”

任务目标：

用相同的优化提示词，测试 3 个不同的开源 LLM（如 Llama 3-8B、ChatGLM-6B、Qwen-7B），对比它们的作文生成效果，选出最适合高中作文场景的模型。

核心对比维度：

对比维度	评分标准（1-5 分）
主题契合度	5 分：完全扣题；3 分：基本扣题；1 分：跑题
逻辑连贯性	5 分：分论点递进清晰；3 分：逻辑基本通顺；1 分：混乱
论据真实性	5 分：论据真实新颖；3 分：论据真实但陈旧；1 分：虚构
语言流畅性	5 分：流畅生动，有修辞；3 分：基本流畅；1 分：语句不通
符合要求度	5 分：完全符合结构、字数要求；3 分：基本符合；1 分：严重不符

实操代码（以 ChatGLM-6B 为例）：

python

运行

# 安装依赖（若未安装） # pip install transformers torch accelerate from transformers import AutoTokenizer, AutoModel # 加载ChatGLM-6B模型 model_name = "THUDM/chatglm-6b" tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True) model = AutoModel.from_pretrained( model_name, trust_remote_code=True, torch_dtype=torch.float16, device_map="auto" ).half() # 输入优化后的提示词（同任务2） prompt = """### 作文要求： 1. 主题：《科技发展与人文温度》（议论文）； 2. 文体：高中高分议论文（符合高考一类文标准）； 3. 结构： - 开头（100字）：用比喻修辞点题（如“科技是船，人文是帆”），引出核心论点“科技发展与人文温度相辅相成，缺一不可”； - 分论点1（200字）：科技发展需以人文为根基（论据：ChatGPT的伦理规范、某科技公司“老人友好型产品”案例）； - 分论点2（200字）：人文温度让科技更有价值（论据：袁隆平杂交水稻技术的人文关怀、医疗AI辅助偏远地区诊断的案例）； - 分论点3（200字）：青年当兼顾科技创新与人文素养（论据：95后工程师研发无障碍科技产品的事迹）； - 结尾（100字）：升华主题，引用名言（如“科技是第一生产力，而人文是科技的灵魂”），联系青年责任。 4. 字数：800字左右（±50字）； 5. 语言风格：正式流畅，多用排比、比喻修辞，分论点开头用“科技为翼，人文为根”“人文为魂，科技为器”等对仗句式； 6. 论据要求：论据为近3年的真实案例（如2023-2025年的科技事件），避免陈旧案例（如爱迪生发明电灯）。 ### 输出： 完整的800字议论文，分段落呈现，标注每个部分（开头、分论点1-3、结尾）。""" # 生成作文 response, history = model.chat(tokenizer, prompt, history=[], max_length=1200) print("ChatGLM-6B生成的作文：") print(response) # 保存作文 with open("ai_essay_chatglm.txt", "w", encoding="utf-8") as f: f.write(response)

任务交付要求：

提交 3 个模型的作文文本（分别标注模型名称）；
提交 “多模型对比评分表”（按上述维度评分）；
附 200 字结论：说明哪个模型最适合高中作文生成，原因是什么（如 “ChatGLM-6B 语言更符合中文表达习惯，论据更具体”）。

4. 选做任务 4：AI 作文鉴别 —— 区分 “AI 写的” 和 “人写的”

任务目标：

给定 5 篇作文（3 篇 AI 生成，2 篇人类高中生写的），用 “人工分析 + 工具验证” 的方式，准确鉴别每篇的来源，鉴别准确率≥80%，深化对 AI 写作特征的理解。

核心鉴别思路：

AI 作文的典型特征（结合高中作文场景）：

语言过于 “完美”：无错别字、无口语化表达、句式结构单一（多为书面语，缺乏个人风格）；
论据 “模板化”：多为常见案例（如 ChatGPT、袁隆平），缺乏个性化论据（如个人经历、小众案例）；
逻辑 “表面流畅”：分论点看似递进，但缺乏深度关联（如 “科技需人文” 和 “人文促科技” 的论证重复）；
细节 “空洞”：对案例的描述过于笼统（如 “某科技公司推出了友好产品”），无具体细节（如产品名称、效果）。

工具验证（复用作业 1 的文本鉴别模型）：

python

运行

# 加载文本鉴别模型 from transformers import pipeline classifier = pipeline( "text-classification", model="roberta-base-openai-detector", return_all_scores=True ) # 待鉴别作文（以人类写的作文为例） human_essay = """《科技发展与人文温度》 科技是船，人文是帆。没有帆的船，即便动力再强，也终将迷失方向；没有船的帆，即便设计再巧，也只能随波逐流。科技发展与人文温度，从来都是相辅相成的共同体。 科技发展需以人文为根基。去年，老家的爷爷学会了用智能手机视频通话，这背后是某手机品牌专门为老年人优化的“大字体、简操作”功能——没有对老年人需求的人文关怀，再先进的通信技术也难以走进千家万户。ChatGPT的研发团队同样注重伦理边界，通过设置“禁止生成有害内容”的规则，让科技始终服务于人类的美好需求。这告诉我们：科技的初心是以人为本，脱离人文的科技，终将失去价值。 人文温度让科技更有价值。袁隆平院士研发杂交水稻，不仅是为了提高粮食产量，更是为了“让所有人远离饥饿”的人文情怀；医疗AI在偏远地区的应用，让山区患者不用奔波就能享受到优质诊断服务，这正是科技与人文结合的生动体现。科技是冰冷的代码和机器，但人文温度能让它变得有温度、有力量。 青年当兼顾科技创新与人文素养。作为一名高中生，我曾参与学校的“无障碍科技”社团，和同学一起为社区老人设计了“语音控制的智能灯”——既用到了Python编程知识，又传递了对老人的关怀。新时代的青年，既要学好科技知识，又要常怀人文之心，让科技成为传递温暖的桥梁。 “科技是第一生产力，而人文是科技的灵魂。” 科技发展的终极目标，是让人类生活更美好。当科技插上人文的翅膀，当人文融入科技的血脉，我们必将迎来一个既先进又温暖的未来。""" # 鉴别 results = classifier(human_essay)[0] ai_score = next(s for s in results if s["label"] == "LABEL_1")["score"] print(f"AI生成概率：{ai_score:.4f}") print(f"鉴别结论：{'AI生成' if ai_score > 0.5 else '人类创作'}")

任务交付要求：

提交 5 篇作文的鉴别报告（含作文文本、人工分析特征、工具预测概率、最终结论）；
附 150 字分析：总结 AI 作文的核心鉴别特征，说明哪些特征最容易误判（如 “高分人类作文语言也很流畅，容易被误判为 AI 生成”）。

三、AI 作文生成的核心逻辑：提示词是 “方向盘”，人是 “驾驶员”

提示词的核心作用：给 AI 明确的 “创作边界” 和 “质量标准”—— 边界越清晰（如分论点方向、论据类型），AI 的输出越精准；标准越具体（如语言风格、结构细节），AI 的输出质量越高；
AI 的局限性：AI 只能基于训练数据中的 “作文模板” 和 “案例库” 生成内容，缺乏真实的生活体验和深度思考 —— 因此，高分作文的核心仍需人的参与（如提供个性化案例、深化分论点逻辑）；
人机协同的本质：AI 负责 “完成基础框架和文字填充”，人负责 “定义主题、优化逻辑、补充细节、注入情感”—— 两者结合，才能既高效又高质量地完成作文创作。

四、作业避坑指南：4 大常见问题解决方案

AI 作文跑题：
- 原因：提示词未明确主题核心（如只说 “科技与人文”，未说 “相辅相成”）；
- 解决：在提示词中直接给出 “核心论点”，并要求每个分论点都围绕核心论点展开。
作文内容空洞、论据不足：
- 原因：提示词未指定论据类型或案例范围；
- 解决：明确要求 “具体案例 + 细节描述”（如 “某手机品牌的‘老人模式’，让 80% 的老人学会了视频通话”），避免笼统表述。
语言风格不符合高中作文要求：
- 原因：提示词未限定语言风格（如 AI 生成过于学术化或口语化的内容）；
- 解决：加入 “语言参考示例”（如 “分论点开头用‘科技为 X，人文为 Y’的对仗句式”），让 AI 更明确风格。
多模型对比时评分不准：
- 原因：评分标准过于主观（如 “语言生动性” 无明确依据）；
- 解决：细化评分标准（如 “语言生动性：5 分 = 每段至少 1 种修辞，3 分 = 有修辞但不自然，1 分 = 无修辞”），减少主观误差。

五、拓展思考：AI 写作对学习的启示

AI 是 “辅助工具”，而非 “替代者”：高中作文的核心是考察 “逻辑思维、语言表达、价值观念”，AI 能帮我们完成文字填充，但无法替代我们的深度思考和情感注入 —— 比如个人经历、独特观点等个性化内容，仍需人来提供；
提示词设计能力 =“清晰表达需求” 的能力：训练 AI 写作的过程，本质是训练 “如何清晰、具体地表达自己的需求”—— 这不仅是 AI 使用能力，更是未来学习和工作的核心能力；
鉴别 AI 作文的能力 =“批判性思维” 的能力：学会区分 AI 生成内容，能让我们更理性地使用 AI，避免过度依赖，同时培养 “质疑、验证、分析” 的批判性思维。

【2026】 LLM 大模型系统学习指南 (44)

都是 AI 的作文比赛 —— 提示词工程与 AI 写作优化实战

一、作业核心目标

二、核心任务拆解：从 “写作文” 到 “会用 AI 写好作文”

1. 必做任务 1：基础提示词设计 —— 让 AI 生成合格作文

任务目标：

核心思路：

提示词设计模板（可直接复用）：

实操代码（用 Llama 3 生成作文）：

任务交付要求：

2. 必做任务 2：提示词优化 —— 让 AI 生成优质作文

任务目标：

核心优化思路：

优化后的提示词模板：

实操与对比：

任务交付要求：

3. 进阶任务 3：多模型对比 —— 选最优 AI “笔友”

任务目标：

核心对比维度：

实操代码（以 ChatGLM-6B 为例）：

任务交付要求：

4. 选做任务 4：AI 作文鉴别 —— 区分 “AI 写的” 和 “人写的”

任务目标：

核心鉴别思路：

工具验证（复用作业 1 的文本鉴别模型）：

任务交付要求：

三、AI 作文生成的核心逻辑：提示词是 “方向盘”，人是 “驾驶员”

四、作业避坑指南：4 大常见问题解决方案

五、拓展思考：AI 写作对学习的启示

聚沙成塔，三步成书：GitBook极简入门教程

口碑推荐！天玑AIGEO优化系统该选哪家？

连锁门店管理系统选型指南：一体化架构如何提升运营效率

ACPI!ACPIDetectFilterDevices函数分析和ACPI!ACPIBuildFilter函数分析

学术写作的“超能引擎”：书匠策AI如何重构期刊论文生产链

【小程序毕设全套源码+文档】django基于协同过滤的校园音乐推荐系统小程序的设计与实现(丰富项目+远程调试+讲解+定制)