Jupyter AI

8 只生成构建第一个GAN之编写生成器模型

📅 发表日期: 2024年8月10日

分类: 🧠GAN 网络教程

👁️阅读: --

在上一篇文章中,我们进行了环境和依赖的设置,确保我们的开发环境准备就绪。现在,我们将专注于生成对抗网络(GAN)的生成器模型的构建。生成器模型是 GAN 中的关键组件,其主要任务是创建新的数据样本,尽量模仿真实的数据分布。

什么是生成器模型

生成器(Generator)接收一个随机噪声向量作为输入,经过一系列的线性变换和激活,最终生成一个接近真实数据的样本。生成器的目标是让判别器(Discriminator)无法区分生成的数据和真实的数据。

构建生成器模型

在构建生成器之前,我们需要明确一些输入和输出的维度。对于像 MNIST 这样的手写数字数据集,我们将生成器设计为一个能够从随机噪声中生成 28x28 的图像。因此,输入层的维度为 100(一个 100 维的随机噪声向量),输出层的维度为 28x28。

生成器的架构

我们将生成器模型中使用几层全连接层,加上一些激活函数,来逐步将随机向量转换为图像。常用的激活函数有 ReLU 和 Tanh。ReLU 在隐藏层中效果不错,而 Tanh 在输出层生成图像时能将值映射到 -1 到 1 的范围,这正好适合归一化后的图像数据。

代码实现

下面是一个简单的生成器模型的实现,我们将采用 Keras 库来构建模型。

import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Reshape, LeakyReLU, BatchNormalization

def build_generator():
    model = Sequential()
    
    # 输入层:100维随机噪声
    model.add(Dense(256, input_dim=100))
    model.add(LeakyReLU(alpha=0.2))  # 使用Leaky ReLU
        
    model.add(Dense(512))              # 第二层:512个神经元
    model.add(LeakyReLU(alpha=0.2))
    model.add(BatchNormalization())    # 批量归一化
     
    model.add(Dense(1024))             # 第三层:1024个神经元
    model.add(LeakyReLU(alpha=0.2))
    model.add(BatchNormalization())
    
    model.add(Dense(28 * 28 * 1, activation='tanh'))  # 输出层,28x28的图像
    model.add(Reshape((28, 28, 1)))  # 重塑为28x28的形状
    
    return model

# 创建生成器模型
generator = build_generator()
generator.summary()  # 打印模型概述

解释代码

  1. 输入层Dense(256, input_dim=100) 表示输入为一个 100 维的随机向量,经由一个全连接层变为 256 维。
  2. 激活函数LeakyReLU 激活函数通过设定一个较小的负斜率,缓解 ReLU 的“死神经元”问题,在生成器中非常常用。
  3. 批量归一化BatchNormalization 层有助于加速训练和提高稳定性,尤其是在深度网络中。
  4. 输出层:最终输出经过 Tanh 激活的 28x28 图像。我们将图像像素值范围映射到 [1,1][-1, 1],而不是常见的 [0,255][0, 255],以便更好地与 GAN 的训练相适应。

测试生成器的输出

我们可以通过随机噪声来验证生成器的创建是否成功,利用如下代码生成一张图像:

import matplotlib.pyplot as plt

# 生成随机噪声
noise = np.random.normal(0, 1, (1, 100))

# 生成图像
generated_image = generator.predict(noise)

# 将值从[-1, 1]转换为[0, 1]
generated_image = (generated_image + 1) / 2.0

# 显示图像
plt.imshow(generated_image[0, :, :, 0], cmap='gray')
plt.axis('off')
plt.show()

上述代码将生成一张经过我们生成器生成的图像并显示出来,确认生成器功能正常。

总结

在本节中,我们成功构建了 GAN 的生成器模型。生成器是 GAN 的重要部分,通过不断学习生成更逼近真实数据的样本。下一篇文章中,我们将继续构建 GAN,专注于判别器模型的编写,敬请期待!