news 2026/4/24 20:52:46

<span class=“js_title_inner“>对人工智能视觉系统进行压力测试:重新思考对抗图像的生成方式</span>

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
<span class=“js_title_inner“>对人工智能视觉系统进行压力测试:重新思考对抗图像的生成方式</span>

IFAP 利用模型梯度生成对抗性扰动,然后在离散余弦变换 (DCT) 域中对其进行整形。与应用固定频率掩码的现有频率感知方法不同,IFAP 引入了一种基于输入图像频谱的输入自适应频谱包络约束。该约束引导扰动的全频谱轮廓与输入图像相符,从而在保持攻击有效性的同时,提高了所生成对抗样本的频谱保真度。图片来源:日本同志社大学奥田正弘教授

编辑:由萨迪·哈雷

审阅:罗伯特·伊根

深度神经网络(DNN)已成为现代人工智能技术的基石,推动了图像相关任务研究领域的蓬勃发展。这些系统已应用于医疗诊断、自动化数据处理、计算机视觉以及各种形式的工业自动化等领域。

随着对人工智能模型的依赖日益加深,使用对抗样本对其进行全面测试的需求也日益迫切。简而言之,对抗样本是指经过策略性噪声修改的图像,旨在诱使人工智能犯错。理解对抗图像生成技术对于识别深度神经网络(DNN)中的漏洞以及开发更安全可靠的系统至关重要。

当前对抗技术的局限性


尽管对抗样本生成技术非常重要,但目前仍存在诸多局限性。科学家们主要致力于通过一种称为 Lp 范数的约束条件,使添加的噪声在数学上变得很小虽然这种方法能够使图像变化保持细微,但往往会导致颗粒状的伪影,由于这些伪影与原始图像的纹理不匹配,因此看起来不自然。

因此,即使噪声很小且难以察觉,安全预过滤器也能轻易地检测并拦截这些噪声,因为它们能够识别异常的频率模式。因此,该领域的一个显著挑战在于,如何超越仅仅最小化噪声量,转而设计更加隐蔽的对抗性攻击。

IFAP框架简介

在此背景下,日本同志社大学理工学研究科的博士生吉田正友和教授奥田正弘开发了一种方法,使对抗样本中的加性噪声与图像的“光谱形状”对齐。

他们的研究发表在IEEE Access期刊上,提出了一种名为输入频率自适应对抗扰动 (IFAP) 的创新框架。

与以往仅操纵特定频段的频率感知方法不同,IFAP采用了一种新的频谱包络约束。这使得添加的噪声能够自适应地匹配输入图像的整个频率分布,从而确保扰动在频谱上忠实于原始内容。

IFAP的测试和评估

研究人员在各种数据集上测试了 IFAP,包括门牌号、一般物体以及地形和织物等复杂纹理。

为了评估其性能,他们使用了一套全面的指标,其中包括他们开发的一种名为频率余弦相似度(Freq_Cossim)的新指标。标准指标通常检查像素级误差,而Freq_Cossim则专门衡量噪声频谱轮廓频率与原始图像频谱轮廓频率的匹配程度。

结果表明,IFAP在结构和纹理相似度方面显著优于现有的对抗生成技术。尽管视觉效果更加自然微妙,但这种对抗攻击仍然非常有效,成功欺骗了多种人工智能架构。

对人工智能鲁棒性和安全性的影响


有趣的是,研究人员还证明,这些协调扰动对常见的图像清理技术(例如JPEG压缩或模糊)具有更强的抵抗力。由于噪声与图像的自然纹理融合得非常紧密,因此简单的变换很难在不显著改变图像本身的情况下将其消除。

IFAP 对人工智能研究中对抗样本的使用方式具有重要意义。通过了解如何创建与人类感知一致的噪声,研究人员可以实施更有效的对抗攻击,从而对人工智能模型进行压力测试和重新训练,使其更加稳健。

“我们相信,我们的研究成果可以用于开发高度可靠的人工智能模型,应用于医疗诊断等领域,这些模型不会受到图像质量或噪声的轻微变化的影响,”奥田教授说。

展望未来,这项研究为我们如何评估人工智能在图像处理任务中的安全性和性能设定了新的基准。

奥田教授总结道:“正如我们的研究提出的那样,强调与人类感知和频率特征一致性的评估标准,在未来五到十年内可能会变得更加普遍。这种转变可能会提高支撑社会重要基础设施(例如医疗保健和交通运输)的人工智能系统的可靠性。”

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 11:28:27

智能交通灯的仿真艺术:Proteus与STM32的完美结合

智能交通灯的仿真艺术:Proteus与STM32的完美结合 1. 虚拟交通控制系统的技术基石 在嵌入式系统开发领域,虚拟仿真技术已经成为工程师和学生的必备技能。Proteus作为业界领先的电路仿真软件,与STM32微控制器的结合,为交通灯系统的…

作者头像 李华
网站建设 2026/4/22 8:15:29

640×640还是800×800?ONNX导出尺寸选择建议

640640还是800800?ONNX导出尺寸选择建议 在将OCR文字检测模型部署到边缘设备、嵌入式系统或跨平台推理引擎时,ONNX格式因其通用性与高效性成为首选。但一个看似简单的参数——输入图像尺寸,却直接影响着模型的精度、速度与内存占用。尤其对于…

作者头像 李华
网站建设 2026/4/23 12:39:13

移动端语音唤醒神器:CTC算法25毫秒极速响应体验

移动端语音唤醒神器:CTC算法25毫秒极速响应体验 你有没有遇到过这样的场景:在地铁里想用语音唤醒手机助手,结果等了快两秒才响应;或者戴着智能手表开会时轻声说“小云小云”,却反复触发失败?不是你发音不准…

作者头像 李华
网站建设 2026/4/23 11:45:42

RexUniNLU基础教程:理解Siamese-UIE双塔结构如何支撑零样本迁移能力

RexUniNLU基础教程:理解Siamese-UIE双塔结构如何支撑零样本迁移能力 1. 什么是RexUniNLU?——一个不用教就能懂的NLU工具 你有没有遇到过这样的问题:刚接手一个新业务线,要快速上线客服对话理解功能,但手头连一条标注…

作者头像 李华
网站建设 2026/4/21 6:42:54

零基础入门:手把手教你用GTE构建智能问答系统

零基础入门:手把手教你用GTE构建智能问答系统 1. 从“问不出答案”到“答得准”:为什么你需要一个轻量级智能问答系统? 你有没有遇到过这样的场景: 在公司内部知识库搜索“报销流程”,结果跳出200条含“报销”二字的…

作者头像 李华
网站建设 2026/4/18 10:39:45

Qwen3-Embedding-4B语义搜索5分钟上手:零基础搭建智能检索系统

Qwen3-Embedding-4B语义搜索5分钟上手:零基础搭建智能检索系统 1. 你不需要懂向量,也能用好语义搜索 你有没有试过在文档里搜“怎么修电脑蓝屏”,结果只找到标题含“蓝屏”的几行字,却漏掉了那篇详细讲“Windows 10系统崩溃后安…

作者头像 李华