生成对抗网络（GAN）的极小极大优化设计-平芜编程栈

原文：towardsdatascience.com/mini-max-optimization-design-of-generative-adversarial-networks-gan-dc1b9ea44a02?source=collection_archive---------8-----------------------#2024-01-12

“在学习的早期，当生成器 G 较差时，判别器 D 可以高信心地拒绝样本，因为它们显然与训练数据不同。在这种情况下，log(1 — D(G(z)))会发生饱和。”

为了解决饱和问题，他们将原始对数似然目标函数的第二项转换如下，并建议生成器最大化这一项：

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1047088989096cf0cee24f1e93409952.png

作者提供的图像

这个公式反映了生成器的目标“最大化 D 犯错的概率”。（Goodfellow 等人，2014，第 1 页）

评估

在训练过程中，生成器不断创造更好的合成数据以欺骗判别器，而判别器则提高其检测能力。从这个角度看，GAN 整体优化的最终目标并不是寻找这两个目标函数的全局最大值，而是寻求一个平衡点，在这个平衡点上，两个代理都无法进一步提升性能。从某种意义上讲，在平衡点，判别器无法区分真实数据和合成数据，因为生成器能够创造尽可能真实的合成数据。

这一目标函数的设定对 GAN 来说非常独特。其中一位联合作者 Ian Goodfellow 描述了平衡点如下：

“它对应于一个鞍点，即分类器的局部最大值和生成器的局部最小值”（Goodfellow I. ，2015，p.2）。

此外，平衡点在概念上可以通过随机猜测的概率 0.5（50%）来表示。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3e74e529cd1bd6b29a7b12545688eb3c.png

作者提供的图片

交替训练过程：嵌套双层优化

为了实现这一最终目标，GAN 设计了一个交替学习过程，在“二级优化”框架中，其中鉴别器的训练循环嵌套在生成器的另一个更高层次的训练循环中。这个二级优化框架使得 GAN 能够在这两个代理之间交替训练过程：k 步的 D 训练和一步 G 训练（Goodfellow 等，2014，p.3）。在这两个模型交替的过程中，重要的是在训练一个模型时冻结另一个模型的学习过程；“在保持鉴别器固定的情况下更新生成器，反之亦然”（Goodfellow I. ，2015，p.3）。

以下算法修订了原始 GAN 论文中提出的原始算法，以充分反映生成器对数似然转换的推荐。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/1c7d25fd63b2c1395701db01c688802a.png

作者提供的图片

正如你在算法中看到的，GAN 在前向传播过程中同时从生成模型（生成器）和真实数据中采样，而在反向传播过程中同时训练这两个代理。（Goodfellow 等，2014，p.2）它遵循了深度神经网络的常规。

GAN 首先在嵌套块中训练鉴别器，然后在每次迭代时训练生成器以欺骗训练过的鉴别器，然后继续迭代这个二级训练，直到达到前面讨论的平衡点。

总体而言，技术上，GAN 通过生成器学习真实数据的概率分布；鉴别器只是嵌套在生成器学习机制中的一个内部组件。生成器的目标函数在其公式的上层优化过程中，反映了训练过的鉴别器模型的逐步内容。换句话说，每次迭代时，一旦鉴别器在嵌套的优化模块中被训练，生成器就会不断更新其目标函数。

这几乎描绘了 GAN 模型优化的算法设计。

总结

为了交替训练两个代理——鉴别器和生成器——GAN 采用了一个双层优化框架，其中鉴别器在嵌套在生成器训练块内的内部模块中进行训练。

由于这两个代理有截然相反的目标（因为判别器旨在最大化其二元分类器的目标函数，而生成器则旨在最小化该函数），合著者称整体目标为“极小极大博弈”。（Goodfellow 等人，2014，第 3 页）总的来说，GAN 通过寻求一个平衡点来实现其极小极大优化（训练）目标，在这个平衡点上，判别器无法再区分真实数据和合成数据，因为现在生成器生成的合成数据与真实数据无法区分。

它的嵌套双层训练框架及其寻求平衡的目标设置（与最大化目标相对）构成了 GAN 的极小极大优化框架。

最后，重要的是要指出，主要作者 Ian Goodfellow 表示，原始的 GAN 是启发式的，并且具有理论上的局限性。例如，当目标函数不是凸函数时，无法保证收敛。在这种背景下，他阐述了 GAN 仍然有进一步创新改进的空间。事实上，针对 GAN 应用的多种变体，已经探索了广泛的评估度量（Borji，2018）。因此，我想强调的是，本文所述的架构设计仅描述了最初的 GAN 论文中提出的 GAN 原型。因此，本文介绍的架构设计并不是对其他类型 GAN 应用的全面或普遍适用的设计。

鉴于这一预警说明已向读者充分传达，我希望本文能对那些刚接触 GAN 的读者有所帮助，帮助他们开启自己的 GAN 之旅。

参考文献

Borji, A. (2018, 10 24). GAN 评估度量的优缺点。来源于 ArXiv:arxiv.org/abs/1802.03446
Goodfellow, I. (2015, 5 21). 关于估计生成模型的可区分性标准。来源于 ArXiv:arxiv.org/abs/1412.6515
Goodfellow, I. J., Pouget-Abadie, J., Mirza, M., Xu, B., Warde-Farley, D., Ozair, S., Courville, A., Bengio, Y. (2014, 6 10). 生成对抗网络。来源于 arXiv:arxiv.org/abs/1406.2661
Knight, W. (2018, 8 17). 让美国再次伟大。来源于 MIT Technology Review:www.technologyreview.com/2018/08/17/240305/fake-america-great-again/

阴阳师自动化工具全攻略：从肝帝解放到欧皇养成

生成对抗网络（GAN）的极小极大优化设计

嵌套双层优化与平衡寻求目标

介绍

原始 GAN 设计

总结

参考文献

音乐格式锁死？这款macOS专用免费音乐格式转换器让你的音频文件重获自由

GTE-Pro开源可部署：GTE-Pro镜像完全开源，支持自主二次开发与模型微调

LSTM在CTC语音唤醒中的应用：小云小云时序建模优化

NS-USBLoader全功能指南：让Switch管理变得简单高效

AI视频创作新选择：AnimateDiff写实风格生成全解析