6 配置虚拟环境
在机器学习和数据科学的项目中,管理不同的项目依赖和环境非常重要。使用虚拟环境可以隔离项目的依赖,确保每个项目使用特定版本的库而不影响其他项目。在这一节中,我们将介绍如何使用 venv
和 conda
工具创建和配置虚拟环境,以便在 Scikit-Learn 项目中使用。
使用 venv
创建虚拟环境
venv
是 Python 内置的一个模块,可以帮助我们创建轻量级的虚拟环境。下面是创建和配置虚拟环境的步骤:
步骤 1:安装 Python
确保你已经安装了 Python。你可以使用以下命令检查你的 Python 安装版本:
1 | python --version |
如果没有安装,可以从 Python 官网下载并安装。
步骤 2:创建虚拟环境
在你的项目目录下,使用以下命令创建一个虚拟环境。假设我们要将虚拟环境命名为 venv
:
1 | python -m venv venv |
步骤 3:激活虚拟环境
在创建虚拟环境后,需要激活它。激活会话会更改你的终端提示符以帮助你识别当前环境。
- 在 Windows 上:
1 | venv\Scripts\activate |
- 在 macOS 或 Linux 上:
1 | source venv/bin/activate |
激活后,你会看到终端提示符前面显示了 (venv)
,表示你现在处于虚拟环境中。
步骤 4:安装依赖库
现在你已经激活了虚拟环境,可以开始安装 Scikit-Learn 和其他依赖库。例如,我们可以使用 pip
安装 Scikit-Learn:
1 | pip install scikit-learn |
你也可以通过 pip install
安装其他常用的库,如 numpy
和 pandas
:
1 | pip install numpy pandas |
步骤 5:验证安装
在安装完成后,可以通过 Python 控制台验证 Scikit-Learn 是否正确安装:
1 | import sklearn |
这将显示你所安装的 Scikit-Learn 的版本号。
使用 conda
创建虚拟环境
如果你更喜欢使用 Anaconda,可以通过 conda
创建和管理虚拟环境。下面是相应的步骤:
步骤 1:安装 Anaconda
如果你还没有安装 Anaconda,可以从 Anaconda官网 下载并安装。
步骤 2:创建虚拟环境
使用以下命令创建一个新的 Conda 虚拟环境,下面的命令中我们将环境命名为 ml-env
:
1 | conda create --name ml-env python=3.8 |
步骤 3:激活虚拟环境
使用以下命令激活你刚才创建的虚拟环境:
1 | conda activate ml-env |
步骤 4:安装依赖库
激活虚拟环境后,你可以用以下命令安装 Scikit-Learn:
1 | conda install scikit-learn |
同样,你可以安装其他库:
1 | conda install numpy pandas |
步骤 5:验证安装
和使用 venv
一样,在 Python 控制台中验证 Scikit-Learn 是否安装成功:
1 | import sklearn |
结束虚拟环境会话
在你完成工作后,可以使用以下命令退出虚拟环境:
venv
:
1 | deactivate |
conda
:
1 | conda deactivate |
总结
通过以上步骤,我们详细介绍了如何使用 venv
和 conda
创建和配置 Python 虚拟环境。这些虚拟环境为我们的 Scikit-Learn 项目提供了一个干净的依赖空间。接下来,我们将进入数据集的处理部分,具体介绍如何加载数据集并为建模做好准备。