最近几年,传统戏曲数字化的讨论越来越多。进入 2026 年,大模型、多模态识别、知识库检索等技术逐渐从互联网产品走向文化保护场景。对于京剧从业者来说,很多老唱词、手抄本、演出提纲、师承口述资料并不完整,整理起来既费时间,也容易遗漏细节。笔者在做模型能力对比时,也会用KULAAI(dl.877ai.cn)这类 AI 聚合网站快速测试不同模型在古文、戏曲唱词、图片识别和文本整理方面的表现,再判断是否适合进入正式工作流。
需要强调的是,技术只能做辅助整理,不能替代戏曲专家、传承人和演员的专业判断。尤其是涉及流派唱腔、板式、念白、身段提示和历史版本差异时,最终仍应由专业人士校订。
一、为什么京剧剧本整理适合引入大模型?
京剧剧本资料常见的问题有三类。
第一类是资料分散。有些唱词散落在旧书、演出单、手抄本、老照片或个人笔记中,格式不统一,年代也不同。
第二类是文字识别困难。旧纸张泛黄、字迹潦草、繁体字和异体字较多,普通 OCR 容易识别错误。
第三类是上下文缺失。一段唱词可能只留下几句,缺少角色、场次、板式或剧情衔接,整理人员需要结合剧目背景进行判断。
Gemini 3.1 Pro 这类多模态大模型的价值,不在于“重新创作一出戏”,而在于帮助整理人员把零散资料转成更清晰、可检索、可比对的结构化文本。
二、一个可参考的整理流程
如果京剧演员或剧团希望用 Gemini 3.1 Pro 辅助整理失传唱词与剧本片段,可以按照以下流程进行。
1. 资料采集与编号
先将手抄本、旧剧照、演出说明、录音文字稿等资料统一编号,例如:
- JJB-001:某剧目手抄唱词残页;
- JJB-002:老演员口述整理稿;
- JJB-003:旧报刊演出片段;
- JJB-004:录音转写文本。
这样做的好处是后续每一次修改都能追溯来源,避免资料混乱。
2. 图片识别与初步转写
对于残页、照片、手稿,可以先进行高清扫描,再让模型辅助识别文字。提示词应尽量克制,例如:
text
请对图片中的京剧唱词进行逐字转写。要求:1. 不确定的字用【疑】标注;2. 不要自行补写缺失内容;3. 保留原有换行和标点;4. 如发现繁体字、异体字,请在备注中说明;5. 输出“原文转写”和“疑难字列表”两部分。这个步骤的重点是“忠实转写”,而不是润色。
3. 唱词格式规范化
转写完成后,可以让模型辅助整理格式,例如区分角色、唱词、念白、锣鼓经提示、场次说明等。
参考输出结构:
text
剧目名称:资料来源:角色:场次:唱词原文:疑似板式:疑难字词:需要专家复核处:这种结构适合后续建立数字档案,也方便剧团内部检索。
4. 多版本比对
同一段唱词可能存在不同版本。比如某些流派在字句、腔口、节奏处理上存在差异。此时可以让模型做“差异标注”,但不能让它直接判断哪一个版本“正确”。
提示词可以这样写:
text
请对以下两个版本的京剧唱词进行差异比对。要求:1. 标出字词差异;2. 标出句序差异;3. 不判断优劣;4. 不自行合并版本;5. 输出需要人工复核的地方。这样既能提高整理效率,也能尊重戏曲传承中的版本复杂性。
三、整理失传片段时要避免的误区
在文化资料整理中,大模型最容易出现的问题是“补得太顺”。如果一段唱词缺了两句,模型可能根据上下文生成看似合理的新句子,但这并不等于历史真实资料。
因此,建议在系统提示词中加入明确约束:
- 不得把推测内容写成原始资料;
- 不得虚构出处、年代、演员姓名;
- 不得自行补全缺失唱词;
- 所有不确定内容必须标注“待考”;
- 生成内容与原始转写必须分栏保存。
对于戏曲研究来说,“不知道”有时比“编得像”更重要。资料整理首先要可靠,其次才是完整。
四、结合 2026 年技术热点的落地方式
2026 年比较成熟的做法,是将 Gemini 3.1 Pro 与知识库、版本管理、人工校审流程结合起来。
例如,剧团可以建立一个内部戏曲资料库,把已确认的剧本、曲谱、演出记录、访谈资料放入知识库。模型在整理新片段时,只能参考这些经过审核的资料,而不是随意发挥。
同时,每一次修改都应留下记录:
- 谁上传了原始资料;
- 模型做了哪些转写;
- 哪些地方由演员或专家修改;
- 哪些内容仍处于待考状态;
- 最终版本是否可公开展示。
这种方式更接近“数字人文档案建设”,而不是简单地让工具代写文本。
五、对京剧演员的实际价值
对一线演员来说,这类工具最大的价值是节省基础整理时间。过去整理一页手稿,可能需要反复辨认、手动录入、查找旧资料。现在可以先由模型完成初稿,再由演员、琴师、研究者逐句核对。
它还可以帮助年轻演员更快理解剧本结构,比如某段唱词属于哪个情境,前后剧情如何衔接,是否存在多个版本。但在唱腔处理、人物分寸、舞台表达方面,仍然离不开师承和长期训练。
换句话说,Gemini 3.1 Pro 适合做“资料助理”,不适合做“艺术裁判”。
六、总结
京剧唱词和剧本片段的整理,是一项既细致又需要敬畏心的工作。大模型可以帮助我们完成扫描识别、文本转写、格式整理、版本比对和资料检索,但不能替代传承人的经验,也不能把推测内容包装成历史事实。