1. 项目概述:当算法画笔遇见彩虹光谱
最近和几位从事数字艺术和社群文化研究的朋友聊天,话题总绕不开一个词:生成式AI。大家一边惊叹于Midjourney、Stable Diffusion带来的视觉革命,一边又对某些AI生成的“酷儿”(Queer)主题作品感到隐隐不安。这种不安不是技术恐惧,而是一种更复杂的感受——当算法开始大规模“学习”并“生产”那些本属于边缘社群的文化符号、身体表达和抗争叙事时,究竟发生了什么?这不仅仅是“画得好不好看”的问题,它触及了数据从何而来、被谁定义、为谁服务,以及最终,这些由数据“喂养”出的AI,是在消解还是在固化社会偏见。
“生成式AI与酷儿艺术:从数据伦理到社群抵抗的深层张力”这个标题,精准地捕捉了这场对话的核心。它探讨的不是一个单纯的技术应用案例,而是一个充满矛盾的交汇点。在这里,最前沿的、由海量数据驱动的自动化创造力,撞上了最强调个体经验、身体政治和文化抵抗的酷儿艺术实践。张力由此产生:AI的“学习”本质上是将非规范的存在纳入统计模型,试图找到“规律”;而酷儿艺术的核心之一,恰恰在于挑战和突破一切关于性别、性向和身体的固有“规律”与规范。这种根本性的冲突,使得每一次AI生成一幅酷儿主题的图像,都可能是一次无意识的“规训”尝试,或是一次充满误读的“翻译”。
理解这个议题,无论对AI开发者、艺术家、社群活动家,还是普通的内容消费者都至关重要。对于开发者,这是在模型训练前就必须正视的数据正义问题;对于艺术家,这是关于创作主权与技术中介的反思;对于社群,这关系到自身的文化表征是否会在算法时代被再次扭曲或剥削。接下来,我将结合技术原理、艺术批评和社群实践,拆解这其中的层层张力,并分享一些在实操中如何更负责任地进行探索的思路。
2. 核心张力解析:算法逻辑与酷儿美学的根本冲突
要理解这场对话的深度,我们必须先抛开对AI“中立工具”的幻想,深入其运作逻辑,并与酷儿艺术的美学和政治诉求进行对照。这种冲突不是表面的,而是植根于两者最基础的“世界观”。
2.1 生成式AI的运作基石:统计平均与模式复制
当前主流的图像生成AI,如Stable Diffusion、DALL-E,其核心是一个被称为“扩散模型”的机器学习架构。简单来说,它的训练过程可以粗暴地理解为:给模型展示数亿张带有文字描述的图片,让它学习“破坏”这些图片(加入噪声),然后再学习如何从噪声中“重建”出符合文字描述的原始图片。经过这个“破坏-重建”的循环,模型内化了一个关于我们这个视觉世界的、巨量的概率分布模型。
关键在于“概率分布”这个词。AI学到的是“最常见”的关联。例如,在学习了海量的网络图片后,它“知道”“婚礼照片”这个词组,最常与“穿白纱的女性”和“穿西装的男性”的像素组合相关联。它生成的不是“创新”,而是基于训练数据统计规律的“高概率拟合”。它的“创造力”是在学习到的模式范围内进行插值和重组。这就带来了几个根本特征:
- 趋向中心化:模型倾向于生成最接近训练数据分布“中心”(即最常见模式)的结果。边缘的、罕见的、反常规的表达,在概率上处于劣势。
- 依赖标签:模型的认知完全依赖于训练时图片所附带的文本描述(即“提示词”)。这些描述的质量、偏见和覆盖范围,直接决定了模型的“世界观”。
- 去语境化:模型学习的是像素间的统计关系,而非图像背后的社会、历史和个人语境。它知道“彩虹旗”的像素排列,但无法理解这面旗帜所承载的平权运动历史、社群认同与抗争血泪。
2.2 酷儿艺术的核心诉求:颠覆规范与彰显存在
酷儿艺术,远不止于描绘LGBTQ+题材。它是一种政治和美学立场,其核心在于:
- 抵抗规范化:酷儿理论批判将性别、性欲、身体强行纳入“男性/女性”、“同性恋/异性恋”等二元对立且僵化的分类体系。酷儿艺术 actively 挑战这些规范,展示流动的、不确定的、混杂的身份和欲望形态。它赞美“之间”的状态,而非清晰的边界。
- 强调具身化与经验:酷儿艺术深深植根于个体的、具体的、常常是创伤性或欢愉性的身体经验。这些经验是难以被简化为标签或通用符号的。一件作品的力量,往往来自它传递的那种独特的、无法被归类的生命感受。
- 语境即内容:酷儿艺术的生产、展示和解读往往与特定的社群空间、历史时刻和政治运动紧密相连。在酒吧里、在游行中、在自出版的小册子上,艺术的行为本身和其存在的语境,共同构成了作品的意义。脱离语境的酷儿符号,其力量会被严重削弱。
- 作者性与社群性:酷儿艺术强调来自社群内部的声音和视角,警惕被外部(尤其是主流、商业或学术机构)的挪用和代言。创作主体是谁,至关重要。
2.3 冲突点的具体呈现
当AI的逻辑遇上酷儿的诉求,张力便在多个层面爆发:
- “平均化” vs “特异性”:AI倾向于生成一个“典型的”、“好看的”酷儿形象(例如,符合主流审美定义的、肤色光洁的、身材匀称的、表情愉悦的酷儿人物),而这恰恰可能消解了酷儿群体内部的巨大差异性(不同的种族、体型、能力、年龄、阶级面貌)以及那些“不美”的、痛苦的、挣扎的真实生存状态。
- “标签驱动” vs “经验驱动”:用户输入“两个男人浪漫接吻”,AI会调用它从海量(可能主要是商业图库或主流影视剧)中学到的关于“浪漫”、“接吻”、“男人”的视觉套路进行合成。它无法理解一段酷儿关系中所特有的、微妙的情感动态、社会压力或私密语言。创作变成了一场“提示词工程”,远离了经验表达。
- “去语境化生成” vs “语境化存在”:AI可以轻松生成一面飘扬的彩虹旗,但这面旗脱离了“石墙事件”的历史语境、脱离了每年骄傲游行的集体欢腾、脱离了一个青少年在卧室里偷偷绘制它的私人抗争,就仅仅成了一个色彩鲜艳的装饰性矢量图形,其政治能量被抽空。
- “数据剥削”的隐忧:许多酷儿艺术家的作品在未经明确同意的情况下,被纳入大型AI训练数据集(如LAION)。他们的创作成果——往往是其生存经验和社群智慧的结晶——被用于训练一个可能最终会稀释、扭曲其原意,甚至与其竞争的商业化系统。这构成了一种数字时代的文化剥削。
注意:这里并非全盘否定AI生成酷儿图像的可能性。许多酷儿艺术家正在积极将AI作为工具,进行批判性使用。关键在于意识到这种内在张力,并主动地、有策略地去应对,而不是无意识地重复其中的偏见。
3. 数据伦理深水区:训练集里的“幽灵”与“暴力”
理解了底层冲突,我们才能进入更棘手的实操层面:数据伦理。这是所有问题的起点。生成式AI的“偏见”并非凭空产生,而是其训练数据的忠实镜像。当我们讨论酷儿艺术与AI时,数据伦理问题尤为尖锐。
3.1 训练数据集的“代表性赤字”与“偏见编码”
目前主导行业的大型多模态数据集,如LAION,是通过从互联网上抓取数十亿计的图像-文本对构建的。互联网本身就不是一个公平的场域,它充斥着历史和社会的不平等。
- 可见性的不平等:在主流互联网平台上,哪些酷儿身体和生活方式被大量展示?往往是那些已经在一定程度上被商业化、被“驯化”、符合中产阶级审美和消费主义的形象。而跨性别者、有色人种酷儿、残障酷儿、非二元性别者等更为边缘的群体,其视觉表征在数据集中很可能是严重不足或扭曲的。AI从这样的数据中学习,只会进一步放大这种“可见性偏见”,让“主流中的主流”成为生成的默认选项。
- 文本描述的暴力:比图像更隐蔽的,是附着于图像的文本描述。这些描述(Alt-text、标题、标签)往往来自上传者或自动标注系统。它们可能包含过时的、侮辱性的、或简单粗暴的标签。例如,一张富有表现力的跨性别者肖像,可能被简单地标记为“男人穿女装”或带有歧视性词汇。AI在学习时,会将这种带有偏见的语言与视觉特征牢固绑定。当用户使用“跨性别者”这个中性词进行生成时,模型内部调用的,可能是被这些有毒文本“污染”过的视觉关联。
- “安全”过滤的误伤:为了生成“安全”的内容,平台方会对训练数据和生成结果进行过滤。然而,“安全”的定义常常是保守的、异性恋本位的。一些描绘酷儿亲密关系、身体或抗争艺术的图像,可能被系统误判为“成人内容”或“敏感内容”而排除在训练集之外,或是在生成时被屏蔽。这导致AI对酷儿生活的理解更加狭隘,仿佛酷儿存在本身就被部分地划入了“不适宜展示”的范畴。
3.2 实操困境:如何获取“更伦理”的数据?
对于想要在相关领域进行开发或创作的个人和团队,直接改变LAION这样规模的数据集不现实。但我们可以从更可控的层面着手:
构建微调数据集:这是目前最可行的路径。不要完全依赖基础大模型。你可以有意识地收集、整理一个小型的、高质量的数据集用于微调模型。
- 来源:优先获取来自酷儿艺术家和社群组织的、有明确授权许可的作品。关注独立艺术平台、社群档案馆、自出版作品。
- 标注:这是关键环节。摒弃简单粗暴的标签。与社群成员合作,为图像撰写丰富、准确、尊重主体性的文本描述。描述应包含形式、情感、文化语境和主体身份。例如,不仅仅是“两个人在跳舞”,而是“两位年长的拉丁裔男同志在社区舞会上即兴跳探戈,笑容中有一种历经岁月后的洒脱与亲密”。
- 工具:可以使用Stable Diffusion的Dreambooth、LoRA等技术,用这个小数据集对基础模型进行微调,让模型学会你数据集中特有的风格和表征方式。
使用“反偏见”提示词工程:在生成时,通过精心设计提示词,主动引导模型避开常见偏见。
- 具体化:避免使用宽泛的“gay couple”(男同伴侣),而是尝试“a gay couple in their 60s gardening together, one using a cane”(一对60多岁、一起园艺的男同伴侣,其中一人使用手杖)。
- 引入对抗性描述:在提示词中加入“stereotypical”(刻板印象的)、“commercial stock photo”(商业图库风格)等负面词汇,有时能帮助模型远离那些过于甜腻或模式化的输出。
- 参考特定艺术家:在提示词中指定你欣赏的、以真实和深刻著称的酷儿摄影师或画家的风格,如“in the style of Catherine Opie or Zanele Muholi”,能将生成结果导向更严肃、更具人文关怀的审美方向。
实操心得:我曾尝试为一个关注多元身体的项目微调模型。最大的教训是,数据标注阶段花费的时间远超预期,但这是最不能偷懒的环节。我们邀请了项目相关的社群成员参与标注讨论会,这个过程本身就成了一个富有启发性的工作坊。最终模型生成的结果,在身体形态的多样性和表情的自然度上,确实比直接使用基础模型有显著提升。这证明,投入伦理的数据工作,在技术上是有效果的。
4. 作为抵抗工具的AI:社群的创造性挪用
尽管存在重重张力,但全球各地的酷儿艺术家和活动家并没有简单地拒绝AI,而是开始了富有创意的“挪用”和“改造”,将AI本身转化为一种抵抗的工具。这种实践的核心在于:不把AI视为权威的创作者,而是将其作为一个不稳定的、可被“黑客”的协作对象,从中催生出意想不到的、具有批判性的结果。
4.1 策略一:暴露与放大算法的偏见
一些艺术项目直接以“暴露AI偏见”为主题。例如,艺术家可以系统性地使用一系列与酷儿身份相关的提示词(如“lesbian wedding”、“transgender body”、“queer family”),收集AI生成的成百上千张结果,然后将其并置展示。这种大规模、系统性的呈现,能让观者直观地看到算法想象中的酷儿生活是多么的同质化、刻板化和被过滤。这类作品本身就成了对AI数据伦理的强烈控诉和公众教育材料。
技术实现思路:
- 使用Stable Diffusion的API或自动化脚本,批量生成同一主题下的变异图像。
- 利用图像聚类算法(如基于CLIP特征向量的聚类),将生成的结果自动分组,可视化地展示模型输出的有限“模板”。
- 将生成日志(包括提示词、模型认为的“不符合安全政策”而被拒绝的生成尝试)也作为作品的一部分展出,揭示平台审查的边界。
4.2 策略二:与AI进行“非标准”对话
挑战AI基于文本提示的交互逻辑。艺术家不追求生成“完美”或“漂亮”的图片,而是故意输入模糊的、矛盾的、诗意的或带有内部冲突的提示词。
- 例如:输入“a body that is both here and not here, a gender that is a whisper not a shout”(一个既在此处又不在此处的身体,一种是低语而非呐喊的性别)。
- 目的:迫使AI在其概率模型的边缘运作,产生扭曲的、模糊的、无法被简单归类的图像。这些“失败”或“怪异”的输出,恰恰可能映射了酷儿经验中那些难以言说的、流动的、非二元的状态。艺术家再将这些AI输出作为素材,进行二次手工创作(绘画、拼贴、数字修改),完成最终的表达。
4.3 策略三:构建“反数据集”与“社群模型”
这是最具建设性也最符合社群精神的实践。如前文所述,社群可以协作创建属于自己的、经过伦理审核的微调数据集。更进一步,可以尝试训练完全基于社群数据的、小型的“反模型”。
- 案例:一个跨性别艺术家团体,收集了数百张由跨性别者自己拍摄、描绘自己日常生活的照片,并配以自己撰写的描述。他们用这些数据训练了一个专门的LoRA模型。这个模型生成的图像,在表现跨性别者面貌、身体和日常生活场景时,摆脱了主流媒体中常见的猎奇或悲情叙事,呈现出一种平静的、多样的、真实的存在感。
- 价值:这不仅是一个技术模型,更是一个政治声明和文化存档。它宣称:关于我们自己的表征,数据主权在我们自己手中。这种模型可能无法生成“一切”,但它能在它关注的特定领域内,提供一种深度真实、充满尊严的视觉语言。
操作流程参考:
- 社群召集与协议制定:明确项目目标、数据贡献的伦理协议(版权、肖像权、用途授权)、收益分享模式(如有)。
- 数据采集与处理:统一图像格式、分辨率。建立匿名化或授权管理流程。
- 协作式标注工作坊:组织线上或线下会议,共同讨论如何为每一张图像撰写最合适的描述文本。这个过程能凝聚共识,丰富描述的维度。
- 模型训练与测试:使用如Stable Diffusion WebUI的LoRA训练功能,在消费级显卡上即可完成。训练后,在社群内部进行多轮测试,评估输出是否符合预期,是否存在意外偏见。
- 发布与共享:将训练好的模型文件在社群内部或遵循伦理的开源协议下分享。同时,可以展示创作过程和成果,形成可复制的实践案例。
5. 未来路径探索:走向更公正的协同创作
面对生成式AI与酷儿艺术之间的张力,悲观拒绝或盲目拥抱都不可取。更可行的路径是走向一种清醒的、批判性的、以社群为主导的协同创作。这需要技术开发者、艺术家、伦理学家和社群成员共同推动以下几个方向的转变:
5.1 技术层面的改进需求
- 可追溯性与同意机制:未来的训练数据集应建立更完善的数据来源追溯系统,并为数据贡献者提供清晰、持久的同意和退出机制。类似于“Creative Commons”但更适应AI训练场景的许可协议亟待发展。
- 偏见检测与缓解工具:开发更精细化的工具,帮助开发者和用户在训练和生成阶段检测潜在的表征偏见(不仅仅是性别、种族,还包括更细微的身体形态、能力、年龄、性别表达等维度),并提供干预选项。
- 支持“小数据”和“私密数据”训练:优化模型架构和训练算法,使其能更好地从高质量、小规模的社群数据中学习,降低对互联网海量“脏数据”的依赖,保护社群数据的隐私性和文化特异性。
5.2 艺术与批评实践的深化
- 发展“元提示词”批判:艺术评论和理论需要发展出一套针对“提示词”本身的分析语言。提示词不再仅仅是工具指令,它本身就是一种充满文化假设和政治立场的“写作”。分析一段提示词预设了何种主体、排除了哪些可能性,将成为AI时代艺术批评的重要任务。
- 拥抱“过程即作品”:将AI生成艺术的重点,从最终的“生成物”部分转移到完整的创作“过程”。这包括:揭示所使用的训练数据来源、展示提示词的迭代与选择、公开模型微调的步骤、甚至展示被过滤掉的结果。这个过程本身,就是对抗AI“黑箱”性和探讨伦理的活生生的作品。
5.3 社群行动与教育倡议
- 开展“数据素养”教育:在酷儿社群和艺术院校中,普及关于AI如何工作、数据如何被使用的知识。让更多人理解自己发布的图片和文字可能如何被用于训练模型,从而做出更知情的选择。
- 建立社群主导的评估框架:不依赖科技公司内部的“负责任AI”评估,而是由多元社群共同制定评估AI生成内容在表征公正性、文化尊重性方面的框架和标准,并以此向平台和开发者问责。
- 倡导“公平补偿”模式:探索可行的商业模式,使得那些其作品被用于训练了商用AI系统的艺术家,能够通过版税池、直接许可费等方式获得公平补偿。这不仅是经济问题,更是对创作价值的承认。
生成式AI与酷儿艺术的相遇,是一场正在进行中的、充满摩擦的对话。它暴露出技术在追求效率和规模时,极易忽视的边缘经验和结构性不平等。然而,也正是这种摩擦,催生了最具活力的批判性思考和创造性实践。最终的图景不应是AI“取代”或“规训”酷儿表达,而是在认识到彼此根本差异的前提下,由社群引导技术,共同开拓出新的、更富伦理意涵的创作前沿。这条路注定复杂,但每一步向前的探索,都在重新定义着技术时代艺术与公正的可能性。