8 只生成构建第一个GAN之编写生成器模型
在上一篇文章中,我们进行了环境和依赖的设置,确保我们的开发环境准备就绪。现在,我们将专注于生成对抗网络(GAN)的生成器模型的构建。生成器模型是 GAN 中的关键组件,其主要任务是创建新的数据样本,尽量模仿真实的数据分布。
什么是生成器模型
生成器(Generator)接收一个随机噪声向量作为输入,经过一系列的线性变换和激活,最终生成一个接近真实数据的样本。生成器的目标是让判别器(Discriminator)无法区分生成的数据和真实的数据。
构建生成器模型
在构建生成器之前,我们需要明确一些输入和输出的维度。对于像 MNIST 这样的手写数字数据集,我们将生成器设计为一个能够从随机噪声中生成 28x28 的图像。因此,输入层的维度为 100(一个 100 维的随机噪声向量),输出层的维度为 28x28。
生成器的架构
我们将生成器模型中使用几层全连接层,加上一些激活函数,来逐步将随机向量转换为图像。常用的激活函数有 ReLU 和 Tanh。ReLU 在隐藏层中效果不错,而 Tanh 在输出层生成图像时能将值映射到 -1 到 1 的范围,这正好适合归一化后的图像数据。
代码实现
下面是一个简单的生成器模型的实现,我们将采用 Keras 库来构建模型。
1 | import numpy as np |
解释代码
- 输入层:
Dense(256, input_dim=100)
表示输入为一个 100 维的随机向量,经由一个全连接层变为 256 维。 - 激活函数:
LeakyReLU
激活函数通过设定一个较小的负斜率,缓解 ReLU 的“死神经元”问题,在生成器中非常常用。 - 批量归一化:
BatchNormalization
层有助于加速训练和提高稳定性,尤其是在深度网络中。 - 输出层:最终输出经过 Tanh 激活的 28x28 图像。我们将图像像素值范围映射到 $[-1, 1]$,而不是常见的 $[0, 255]$,以便更好地与 GAN 的训练相适应。
测试生成器的输出
我们可以通过随机噪声来验证生成器的创建是否成功,利用如下代码生成一张图像:
1 | import matplotlib.pyplot as plt |
上述代码将生成一张经过我们生成器生成的图像并显示出来,确认生成器功能正常。
总结
在本节中,我们成功构建了 GAN 的生成器模型。生成器是 GAN 的重要部分,通过不断学习生成更逼近真实数据的样本。下一篇文章中,我们将继续构建 GAN,专注于判别器模型的编写,敬请期待!
8 只生成构建第一个GAN之编写生成器模型