8 只生成构建第一个GAN之编写生成器模型

在上一篇文章中，我们进行了环境和依赖的设置，确保我们的开发环境准备就绪。现在，我们将专注于生成对抗网络（GAN）的生成器模型的构建。生成器模型是 GAN 中的关键组件，其主要任务是创建新的数据样本，尽量模仿真实的数据分布。

什么是生成器模型

生成器（Generator）接收一个随机噪声向量作为输入，经过一系列的线性变换和激活，最终生成一个接近真实数据的样本。生成器的目标是让判别器（Discriminator）无法区分生成的数据和真实的数据。

构建生成器模型

在构建生成器之前，我们需要明确一些输入和输出的维度。对于像 MNIST 这样的手写数字数据集，我们将生成器设计为一个能够从随机噪声中生成 28x28 的图像。因此，输入层的维度为 100（一个 100 维的随机噪声向量），输出层的维度为 28x28。

生成器的架构

我们将生成器模型中使用几层全连接层，加上一些激活函数，来逐步将随机向量转换为图像。常用的激活函数有 ReLU 和 Tanh。ReLU 在隐藏层中效果不错，而 Tanh 在输出层生成图像时能将值映射到 -1 到 1 的范围，这正好适合归一化后的图像数据。

代码实现

下面是一个简单的生成器模型的实现，我们将采用 Keras 库来构建模型。

import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Reshape, LeakyReLU, BatchNormalization

def build_generator():
    model = Sequential()
    
    # 输入层：100维随机噪声
    model.add(Dense(256, input_dim=100))
    model.add(LeakyReLU(alpha=0.2))  # 使用Leaky ReLU
        
    model.add(Dense(512))              # 第二层：512个神经元
    model.add(LeakyReLU(alpha=0.2))
    model.add(BatchNormalization())    # 批量归一化
     
    model.add(Dense(1024))             # 第三层：1024个神经元
    model.add(LeakyReLU(alpha=0.2))
    model.add(BatchNormalization())
    
    model.add(Dense(28 * 28 * 1, activation='tanh'))  # 输出层，28x28的图像
    model.add(Reshape((28, 28, 1)))  # 重塑为28x28的形状
    
    return model

# 创建生成器模型
generator = build_generator()
generator.summary()  # 打印模型概述

解释代码

输入层：Dense(256, input_dim=100) 表示输入为一个 100 维的随机向量，经由一个全连接层变为 256 维。
激活函数：LeakyReLU 激活函数通过设定一个较小的负斜率，缓解 ReLU 的“死神经元”问题，在生成器中非常常用。
批量归一化：BatchNormalization 层有助于加速训练和提高稳定性，尤其是在深度网络中。
输出层：最终输出经过 Tanh 激活的 28x28 图像。我们将图像像素值范围映射到 $[-1, 1]$ ，而不是常见的 $[0, 255]$ ，以便更好地与 GAN 的训练相适应。

测试生成器的输出

我们可以通过随机噪声来验证生成器的创建是否成功，利用如下代码生成一张图像：

import matplotlib.pyplot as plt

# 生成随机噪声
noise = np.random.normal(0, 1, (1, 100))

# 生成图像
generated_image = generator.predict(noise)

# 将值从[-1, 1]转换为[0, 1]
generated_image = (generated_image + 1) / 2.0

# 显示图像
plt.imshow(generated_image[0, :, :, 0], cmap='gray')
plt.axis('off')
plt.show()

上述代码将生成一张经过我们生成器生成的图像并显示出来，确认生成器功能正常。

总结

在本节中，我们成功构建了 GAN 的生成器模型。生成器是 GAN 的重要部分，通过不断学习生成更逼近真实数据的样本。下一篇文章中，我们将继续构建 GAN，专注于判别器模型的编写，敬请期待！