AI编程网

2024-08-07发表2024-08-10更新AI / GenerativeAI7 分钟读完 (大约1026个字)

7 从零开始生成式AI教程

引言

生成式AI是指使用算法生成新数据的机器学习技术。它在图像生成、文本创作、音乐编写等多个领域得到了广泛应用。本教程将帮助你从基础知识入手，逐步理解生成式AI的各个方面。

生成式AI简介

生成式AI是通过学习已有的数据分布，以生成新的样本。与判别模型（如分类模型）不同，生成模型关注的是数据本身，而不是数据与标签之间的关系。

基础概念

数据分布：描述数据所遵循的概率分布。
生成模型：根据训练数据学习数据分布，并能够生成符合该分布的新数据。

生成式模型的类型

生成对抗网络（GAN）
GAN由两个网络组成：生成器和判别器。生成器试图生成逼真的数据，而判别器试图区分真实数据和生成数据。

import torch
from torch import nn

class Generator(nn.Module):
    def __init__(self):
        super(Generator, self).__init__()
        self.model = nn.Sequential(
            nn.Linear(100, 256),
            nn.ReLU(),
            nn.Linear(256, 512),
            nn.ReLU(),
            nn.Linear(512, 1024),
            nn.ReLU(),
            nn.Linear(1024, 784),
            nn.Tanh()
        )

    def forward(self, z):
        return self.model(z)

变分自编码器（VAE）
VAE通过编码器将输入数据压缩为潜在空间中的分布，然后通过解码器重建数据。

class VAE(nn.Module):
    def __init__(self):
        super(VAE, self).__init__()
        self.encoder = nn.Sequential(
            nn.Linear(784, 400),
            nn.ReLU()
        )
        self.fc_mu = nn.Linear(400, 20)
        self.fc_logvar = nn.Linear(400, 20)
        self.decoder = nn.Sequential(
            nn.Linear(20, 400),
            nn.ReLU(),
            nn.Linear(400, 784),
            nn.Sigmoid()
        )

    def reparameterize(self, mu, logvar):
        std = torch.exp(0.5 * logvar)
        eps = torch.randn_like(std)
        return mu + eps * std

基础框架与工具

深度学习框架：如PyTorch、TensorFlow，它们提供了构建和训练模型的工具。
数据集：常用的数据集如MNIST、CIFAR-10等。

构建一个简单的生成式模型

以生成对抗网络（GAN）为例，以下是构建和训练一个简单GAN的步骤。

数据准备

使用torchvision加载MNIST数据集。

import torchvision.datasets as dsets
import torchvision.transforms as transforms

transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))
])

mnist_dataset = dsets.MNIST(root='./data', train=True, transform=transform, download=True)
data_loader = torch.utils.data.DataLoader(dataset=mnist_dataset, batch_size=64, shuffle=True)

定义训练过程

训练GAN模型的代码如下：

def train_gan(generator, discriminator, data_loader, num_epochs=100):
    criterion = nn.BCELoss()
    optimizer_g = torch.optim.Adam(generator.parameters(), lr=0.0002, betas=(0.5, 0.999))
    optimizer_d = torch.optim.Adam(discriminator.parameters(), lr=0.0002, betas=(0.5, 0.999))

    for epoch in range(num_epochs):
        for real_images, _ in data_loader:
            # Train Discriminator
            optimizer_d.zero_grad()
            real_labels = torch.ones(real_images.size(0), 1)
            fake_labels = torch.zeros(real_images.size(0), 1)

            outputs = discriminator(real_images)
            d_loss_real = criterion(outputs, real_labels)

            noise = torch.randn(real_images.size(0), 100)
            fake_images = generator(noise)
            outputs = discriminator(fake_images.detach())
            d_loss_fake = criterion(outputs, fake_labels)

            d_loss = d_loss_real + d_loss_fake
            d_loss.backward()
            optimizer_d.step()

            # Train Generator
            optimizer_g.zero_grad()
            outputs = discriminator(fake_images)
            g_loss = criterion(outputs, real_labels)
            g_loss.backward()
            optimizer_g.step()

        print(f'Epoch [{epoch}/{num_epochs}], d_loss: {d_loss.item()}, g_loss: {g_loss.item()}')

# 实例化模型，并开始训练
generator = Generator()
discriminator = Discriminator()
train_gan(generator, discriminator, data_loader)

训练模型

使用数据集通过反向传播训练生成器和判别器，更新其参数，使生成的数据越来越真实。

评估模型性能

可以通过生成样本和使用指标（如Fréchet Inception Distance (FID)）来评估模型的表现。

结论

本文介绍了生成式AI的基础知识、模型类型以及一个简单的GAN模型的实现。希望这能为你深入学习生成式AI打下基础。接下来的学习可以考虑更复杂的网络结构和更多的应用场景。

2024-08-07发表2024-08-10更新AI / GenerativeAI7 分钟读完 (大约1001个字)

8 从零开始生成式AI详细教程

1. 引言

生成式AI（Generative AI）是指能够生成文本、图像、音频等数据的人工智能模型。本教程将重点介绍如何使用OpenAI的GPT-3/GPT-4进行文本生成。我们将涵盖基本概念、环境配置、模型调用、文本生成实例以及调优技巧。

2. 基本概念

在开始之前，了解生成式AI的一些基本概念是很重要的：

生成模型：一种能够学习并生成与训练数据相似的新数据的模型。
GPT（Generative Pre-trained Transformer）：一种使用深度学习的自然语言处理模型，专门用于生成连贯的文本。

3. 环境配置

在开始编写代码之前，确保您具备以下环境：

3.1 注册OpenAI账户

前往OpenAI官网并注册账户。
访问API密钥页面，获取您的API密钥。

3.2 安装所需软件

确保安装了Python。推荐使用Python 3.7或更高版本。接下来，安装所需的库：

1	pip install openai

4. 调用GPT-3/GPT-4生成文本

4.1 简单的文本生成示例

以下是一个使用OpenAI API进行文本生成的基本示例：

import openai

# 设置API密钥
openai.api_key = 'your-api-key'

# 调用GPT-3/GPT-4生成文本
response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[
        {"role": "user", "content": "给我讲一个关于勇气的故事。"}
    ]
)

# 输出生成的内容
print(response['choices'][0]['message']['content'])

4.2 如何配置请求参数

调用API时可以自定义一些参数，例如：

model：使用的模型版本（如 gpt-3.5-turbo 或 gpt-4）。
messages：用于构建对话的消息列表。
temperature：控制生成文本的随机性，值越高，生成文本越随机（范围：0-1）。

response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[
        {"role": "user", "content": "写一篇关于人工智能的论文。"}
    ],
    temperature=0.7  # 增加生成的多样性
)

5. 文本生成的典型应用案例

5.1 创作与写作

GPT-3/GPT-4可以帮助作家生成故事情节、角色设定等。

prompt = "请帮我写一段关于一位勇敢骑士拯救公主的故事。"
response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[{"role": "user", "content": prompt}]
)

5.2 问答系统

使用GPT构建智能问答系统。

question = "什么是机器学习？"
response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[{"role": "user", "content": question}]
)

6. 输入优化和提示技巧

生成的文本质量在很大程度上取决于输入提示的设计。以下是一些优化输入的技巧：

提供清晰的上下文：确保问题或命令简单明了。
使用具体的指示：例如，指定格式（如“列出”或“简要说明”）。

prompt = "请以列表的形式列出机器学习的5个主要优点。"
response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[{"role": "user", "content": prompt}]
)

7. 故障排除与最佳实践

7.1 常见问题

API调用失败：检查API密钥是否正确，确保有足够的调用配额。
生成的文本不相关：尝试修改提示或调整temperature参数。

7.2 最佳实践

经常记录生成的文本，以便进一步分析和改进提示。
使用逻辑清晰的对话结构，确保对话的连贯性。

8. 后续学习

深入了解生成式AI可以扩展到其他领域，如图像生成、音频生成等。推荐资料：

OpenAI的文档：OpenAI API Documentation
学习深度学习与自然语言处理基础。

9. 结论

本教程介绍了如何从零开始利用GPT-3/GPT-4生成文本，包括环境配置、代码示例、提示技巧及常见问题的解决。如有需要，您可以继续探索更深层次的应用与技术。希望本教程能对您有所帮助！

2024-08-07发表2024-08-10更新AI / GenerativeAI6 分钟读完 (大约968个字)

9 从零学生成式AI文本生成小节评估方法

在构建生成式AI文本的过程中，评估生成文本的质量是一个至关重要的环节。本节将详细介绍一些常用的评估方法，包括自动评估和人工评估两种方式，并给出具体的案例和代码示例。

1. 自动评估方法

1.1 BLEU（Bilingual Evaluation Understudy）

BLEU 是一种常用的自动评估指标，特别适用于机器翻译和文本生成领域。其通过计算生成文本和参考文本之间的n-gram重叠来量化文本的相似性。

1.1.1 BLEU计算方法

公式如下：

1	BLEU = BP * exp(∑(p_n) / N)

其中：

BP 是惩罚因子，用于惩罚生成文本比参考文本短。
p_n 是n-gram精确度。
N 是n的取值，即使用几种n-gram。

1.1.2 示例代码

以下是计算BLEU分数的Python代码示例：

from nltk.translate.bleu_score import sentence_bleu

# 参考文本和生成文本
reference = [["this", "is", "a", "test"], ["this", "is", "test"]]
candidate = ["this", "is", "a", "test"]

# 计算BLEU分数
bleu_score = sentence_bleu(reference, candidate)
print(f"BLEU Score: {bleu_score:.4f}")

1.2 ROUGE（Recall-Oriented Understudy for Gisting Evaluation）

ROUGE 是另一种常用的评估指标，主要用于评估自动摘要和文本生成。

1.2.1 ROUGE类型

ROUGE-N：计算n-gram重叠数量。
ROUGE-L：基于最长公共子序列（LCS）计算。

1.2.2 示例代码

以下是计算ROUGE分数的Python代码示例：

from rouge import Rouge

rouge = Rouge()

# 参考文本和生成文本
reference = "The cat is sitting on the mat."
candidate = "The cat sits on the mat."

# 计算ROUGE分数
scores = rouge.get_scores(candidate, reference)
print(scores)

2. 人工评估方法

尽管自动评估方法具有一定的便利性，但人工评估仍然是非常重要的，因为人工评估能够捕捉到一些自动评估无法检测到的细致差异。

2.1 评估标准

在进行人工评估时，可以考虑以下几个标准：

流畅性：文本是否通顺，语法是否正确。
连贯性：文本的逻辑结构是否合理，主题是否一致。
相关性：文本与给定主题或问题的相关程度。
创意性：文本内容的新颖度和创造性。

2.2 人工评分示例

在实际操作中，可以设计一个评估表格，让评估者给每个标准打分，例如：

评估标准	分数（1-5）
流畅性	4
连贯性	5
相关性	3
创意性	4

2.3 案例

假设生成的文本为：

1	"人工智能将改变我们的生活，但我们需要谨慎对待它。"

评估者可以按照上述标准进行打分，并给出反馈意见：

流畅性：文本流畅，值得5分。
连贯性：逻辑严谨，值得5分。
相关性：与科技话题相关，值3分。
创意性：内容相对常见，值3分。

3. 综合评估结果

在评估过程中，建议结合自动评估和人工评估的结果，以获得更全面的文本质量评估。例如，可以将自动评估的BLEU分数和人工评估得分进行加权计算，得到最终的综合评分。

# 假设BLEU分数和人工评估得分
bleu_score = 0.75
human_scores = {
    "fluency": 4,
    "coherence": 5,
    "relevance": 3,
    "creativity": 4
}

# 综合评分计算
final_score = 0.5 * bleu_score + 0.5 * (sum(human_scores.values()) / len(human_scores))
print(f"Final Evaluated Score: {final_score:.4f}")

结论

在文本生成的评估中，自动评估和人工评估各有优劣，结合使用是最有效的方式。通过合理的评估方法，可以更好地提升生成式AI的文本质量，为用户提供更优质的内容。

目录

引言