25 11.2 实战案例讲解

在本节中,我们将通过一个具体的案例来展示如何利用 TensorFlow 实现一个简单的深度学习项目。我们将结合 11.1 节中提到的项目需求进行实战讲解。项目的目标是使用神经网络来对手写数字进行分类,并且我们将使用 MNIST 数据集作为我们的训练和测试数据。

项目背景

在机器学习领域,手写数字识别是一个经典的任务。MNIST 数据集包含了 70,000 张 28x28 像素的手写数字图像,其中 60,000 张用于训练,10,000 张用于测试。任务的目标是根据输入的图像预测出对应的数字(0-9)。

前期准备

在开始之前,我们需要安装 TensorFlow 库。打开终端并运行以下命令:

1
pip install tensorflow

数据加载与预处理

首先,我们需要加载 MNIST 数据集并对数据进行预处理。在 TensorFlow 中,可以使用 tf.keras.datasets 来方便地加载数据。

以下是加载和预处理数据的代码:

1
2
3
4
5
6
7
8
9
import tensorflow as tf
from tensorflow.keras import layers, models

# 加载 MNIST 数据集
(train_images, train_labels), (test_images, test_labels) = tf.keras.datasets.mnist.load_data()

# 数据标准化,转换到 [0, 1] 之间
train_images = train_images.astype('float32') / 255.0
test_images = test_images.astype('float32') / 255.0

这段代码完成了以下几件事情:

  1. 加载 MNIST 数据集,并将数据集分为训练集和测试集。
  2. 将图像的像素值转换为 float32 类型并进行标准化,确保值在 [0, 1] 之间。

搭建神经网络模型

接下来,我们将搭建一个简单的神经网络模型。我们选择一个包含两个全连接层的模型,其中使用 ReLU 激活函数和 softmax 输出层。

以下是模型的构建代码:

1
2
3
4
5
model = models.Sequential([
layers.Flatten(input_shape=(28, 28)), # 将 28x28 的图像展平为一维
layers.Dense(128, activation='relu'), # 第一层:128 个神经元,ReLU 激活函数
layers.Dense(10, activation='softmax') # 输出层:10 个神经元,softmax 激活函数
])

编译模型

在训练模型之前,我们需要编译模型,指定损失函数和优化器。我们使用 sparse_categorical_crossentropy 作为损失函数,因为我们的标签是整数形式,adam 作为优化器。

以下是编译模型的代码:

1
2
3
model.compile(optimizer='adam',
loss='sparse_categorical_crossentropy',
metrics=['accuracy'])

训练模型

接下来,我们将使用训练数据来训练模型。我们指定训练的轮数为 5,并设置批次大小为 32。

以下是训练模型的代码:

1
model.fit(train_images, train_labels, epochs=5, batch_size=32)

评估模型

训练完成后,我们需要在测试集上评估模型的性能。我们将使用 evaluate 方法来计算模型的损失和准确率。

以下是评估模型的代码:

1
2
test_loss, test_accuracy = model.evaluate(test_images, test_labels)
print(f"Test accuracy: {test_accuracy:.4f}")

使用模型进行预测

最后,我们可以使用训练好的模型对新的手写数字进行预测。我们将用测试集中的前五个图像进行示范。

以下是进行预测的代码:

1
2
3
4
predictions = model.predict(test_images[:5])
predicted_classes = tf.argmax(predictions, axis=1)
print(f"Predicted classes: {predicted_classes.numpy()}")
print(f"True classes: {test_labels[:5]}")

总结

在本节中,我们详细介绍了如何使用 TensorFlow 搭建一个简单的手写数字识别模型。我们完成了以下步骤:

  1. 加载和预处理 MNIST 数据集。
  2. 搭建神经网络模型。
  3. 编译和训练模型。
  4. 评估模型的性能。
  5. 使用模型进行预测。

此案例展示了使用 TensorFlow 进行深度学习项目的基础流程,也是今后深入学习的基础。在下一节中,我们将讨论对模型进行调优的技术与方法,进一步提升模型的性能。

25 11.2 实战案例讲解

https://zglg.work/tensorflow-zero/25/

作者

AI免费学习网(郭震)

发布于

2024-08-10

更新于

2024-08-11

许可协议

分享转发

交流

更多教程加公众号

更多教程加公众号

加入星球获取PDF

加入星球获取PDF

打卡评论