news 2026/2/25 20:38:41

维基百科志愿者创建AI写作特征库,现推出插件帮助规避检测

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
维基百科志愿者创建AI写作特征库,现推出插件帮助规避检测

上周六,科技企业家Siqi Chen发布了一个开源插件,专门用于Anthropic公司的Claude Code AI助手,该插件能指导AI模型避免使用典型的AI写作风格。这个名为"Humanizer"的简单提示插件向Claude提供了一份包含24种语言和格式模式的清单,这些模式都是维基百科编辑总结出的聊天机器人写作特征。Chen在GitHub上发布了该插件,截至周一已获得超过1600个星标。

"维基百科整理出详细的'AI写作迹象'清单真的很有用,"Chen在X平台上写道。"有用到你可以直接告诉你的大语言模型...不要那样做。"

该工具的源材料来自维基百科的WikiProject AI Cleanup项目,这是一个自2023年底以来一直在寻找AI生成文章的维基百科编辑团队。法国维基百科编辑Ilyas Lebleu创立了这个项目。志愿者们已经标记了超过500篇文章进行审核,并在2025年8月发布了他们不断观察到的模式的正式清单。

Chen的工具是Claude Code的"技能文件",这是Anthropic基于终端的编程助手的一种功能,涉及一个Markdown格式的文件,该文件添加了一系列书面指令,附加到输入驱动助手的大语言模型的提示中。与普通系统提示不同,技能信息以标准化方式格式化,Claude模型经过微调后能够比普通系统提示更精确地解释这些信息。

在有限的测试中,Chen的技能文件确实使智能体的输出听起来不那么精确,更加随意,但它可能存在一些缺点:不会改善事实准确性,可能会影响编程能力。特别是,Humanizer的一些指令可能会误导用户。例如,该技能包含这样的指令:"要有观点。不要只是报告事实——要对它们做出反应。'我真的不知道该如何看待这件事'比中性地列出利弊更人性化。"虽然不完美看起来很人性化,但如果你使用Claude编写技术文档,这种建议可能不会对你有任何帮助。

AI写作模式识别

那么AI写作是什么样的呢?维基百科指南提供了具体的例子。一些聊天机器人喜欢用诸如"标志着一个关键时刻"或"见证了"等短语来夸大其主题。它们像旅游手册一样写作,称景色"令人叹为观止",将城镇描述为"坐落在"风景区内。它们在句子末尾添加"-ing"短语以显得分析性:"象征着该地区对创新的承诺。"

为了规避这些规则,Humanizer技能告诉Claude用简单的事实替换夸大的语言,并提供了这个转换示例:

修改前:"加泰罗尼亚统计研究所于1989年正式成立,标志着西班牙地区统计发展的关键时刻。"

修改后:"加泰罗尼亚统计研究所成立于1989年,负责收集和发布地区统计数据。"

为什么AI写作检测会失败

即使有维基百科编辑制定的如此自信的规则集,AI写作检测器也无法可靠工作:人类写作没有什么内在独特性能够可靠地将其与大语言模型写作区分开来。

一个原因是,即使大多数AI语言模型倾向于某些类型的语言,它们也可以通过提示来避免这些语言,就像Humanizer技能一样。此外,人类也可能以聊天机器人式的方式写作。例如,这篇文章可能包含一些"AI写作特征",即使它是由专业作家写的,也会触发AI检测器——特别是如果我们甚至使用一个破折号——因为大多数大语言模型从网络上抓取的专业写作示例中学到了写作技巧。

维基百科指南有一个值得注意的警告:虽然该清单指出了一些明显的迹象,但它仍然由观察组成,而不是铁板钉钉的规则。页面上引用的2025年预印本发现,大语言模型的重度用户能够在90%的情况下正确识别AI生成的文章。这听起来不错,直到你意识到10%是误报,这足以在追求检测AI垃圾内容的过程中可能抛弃一些高质量的写作。

从更广的角度来看,这可能意味着AI检测工作需要深入到特定措辞标记之外,更多地深入到作品本身的实质性事实内容中。

Q&A

Q1:Humanizer插件是什么?它有什么功能?

A:Humanizer是由科技企业家Siqi Chen开发的开源插件,专门用于Anthropic公司的Claude Code AI助手。它的主要功能是指导AI模型避免使用典型的AI写作风格,通过向Claude提供包含24种语言和格式模式的清单,帮助AI生成更像人类的文本。

Q2:维基百科如何识别AI写作特征?

A:维基百科的WikiProject AI Cleanup项目团队通过分析AI生成文章总结出了具体的写作模式。例如,AI喜欢使用"标志着关键时刻"、"见证了"等夸大短语,像旅游手册一样称景色"令人叹为观止",或在句子末尾添加"-ing"短语显得更有分析性。

Q3:AI写作检测为什么不够可靠?

A:AI写作检测不可靠的主要原因是人类写作没有内在独特性能够可靠地与大语言模型写作区分开来。AI模型可以通过提示避免特定的写作模式,而人类有时也会以类似聊天机器人的方式写作。研究显示即使是重度用户也有10%的误报率,足以影响检测准确性。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/23 9:45:47

Mobileye关键之年,Robotaxi去安全员、SuperVisionChauffeur迈入量产

作者 |德新 编辑 |王博2026年,被Mobileye创始人兼CEO Amnon Shashua教授视为关键的一年,这年公司将会达成两项重要的里程碑: 第一,Robotaxi实现 “去安全员”无人化驾驶;第二,与保时捷合作的SuperVision&am…

作者头像 李华
网站建设 2026/2/22 2:04:08

AI如何优化电网:三个关键问题解析

人工智能近期因其快速增长的能源需求而频频登上头条,特别是支持最新生成式AI模型训练和部署的数据中心电力使用量激增。但这并非全是坏消息——一些AI工具有潜力减少某些形式的能源消耗,并促进更清洁的电网建设。其中最具前景的应用之一是使用AI优化电网…

作者头像 李华
网站建设 2026/2/8 1:44:19

计算机Java毕设实战-基于SpringBoot+Vue线上素菜超市平台蔬菜商城springboot的蔬菜超市系统【完整源码+LW+部署说明+演示视频,全bao一条龙等】

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/2/24 22:40:12

day166—递归—多边形三角剖分的最低得分(LeetCode-1039)

题目描述你有一个凸的 n 边形,其每个顶点都有一个整数值。给定一个整数数组 values ,其中 values[i] 是按 顺时针顺序 第 i 个顶点的值。假设将多边形 剖分 为 n - 2 个三角形。对于每个三角形,该三角形的值是顶点标记的乘积,三角…

作者头像 李华
网站建设 2026/2/5 9:47:06

python之lession7-迭代器和生成器

案例一:迭代器访问 import syslist[1,2,3,4] it iter(list) while True:try:print(next(it))except StopIteration:sys.exit()案例二:使用class类创建一个迭代器 class MyNumbers:def __iter__(self):self.a 1return selfdef __next__(self):x self.a…

作者头像 李华
网站建设 2026/2/20 5:07:55

dssenh.dll文件丢失找不到 免费下载方法分享

在使用电脑系统时经常会出现丢失找不到某些文件的情况,由于很多常用软件都是采用 Microsoft Visual Studio 编写的,所以这类软件的运行需要依赖微软Visual C运行库,比如像 QQ、迅雷、Adobe 软件等等,如果没有安装VC运行库或者安装…

作者头像 李华