解决(几乎)任何机器学习问题(1、建立你的工作环境)

plantago / 2023-07-29 / 原文

原作者:Abhishek Thakur
原文:GitHub - abhishekkrthakur/approachingalmost: Approaching (Almost) Any Machine Learning Problem

1、建立你的工作环境

在我们开始编码之前,在你的机器上设置好一切是非常重要的。在本书中,我们将使用 Ubuntu 18.04Python 3.7.6。 如果你是 Windows 用户,可以通过多种方式安装 Ubuntu。 例如,在虚拟机上安装由甲骨文公司提供的免费软件 Virtual Box。 与Windows一起作为双启动系统。 我更喜欢双启动,因为它是原生的。 如果你不是Ubuntu用户,在使用本书中的某些bash脚本时可能会遇到问题。 为了避免这种情况,你可以在虚拟机中安装Ubuntu,或者在Windows上安装Linux shell。

使用 Anaconda,在任何机器上设置 Python 都非常简单。我特别喜欢 Miniconda 它是 conda 的最小安装程序。它适用于 Linux、OSX 和Windows。由于 Python 2 支持已于 2019 年底结束,我们将使用 Python 3 发行版。您应该记住,miniconda 并不像普通的 与普通 Anaconda 一样附带所有软件包。因此,我们将在安装软件包时 安装软件包。安装 miniconda 非常简单。

您需要做的第一件事是将Miniconda3下载到您的系统中。

$ cd ~/Downloads
$ wget https://repo.anaconda.com/miniconda/...

其中wget命令后的URL是来自miniconda3网页的URL。对于64位Linux系统,在撰写本书时的URL是:

https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

下载miniconda3后,可以运行以下命令:

$ sh Miniconda3-latest-Linux-x86_64.sh

接下来,请阅读并按照屏幕上的说明进行操作。如果您正确安装了所有内容,那么您应该能够通过在终端中键入conda-init来启动conda环境。我们将创建一个我们将在本书中使用的conda环境。要创建conda环境,可以键入:

$ conda create -n environment_name python=3.7.6

此命令将创建一个名为environment_name的conda环境,该环境可以使用以下方式激活:

$ conda activate environment_name

我们激活了环境。现在是时候安装一些我们将要使用的软件包了。当您在conda环境中时,可以通过两种不同的方式安装软件包。您可以从conda存储库或官方PyPi存储库安装软件包。

$ conda/pip install package_name

注意:conda的repo中可能没有某些包。因此,使用pip进行安装将是本书中最受欢迎的方式。我已经创建了一个写这本书时使用的包列表,保存在environment.yml中。你可以在我的GitHub存储库中的额外材料中找到它。可以使用以下命令创建环境:

$ conda env create -f environment.yml

此命令将创建一个名为ml的环境。要激活此环境并开始使用它,您应该运行:

$ conda activate ml

我们都做好了准备,准备进行一些应用机器学习!

与本书一起编写代码时,请始终记住处于“ml”环境中。

现在让我们从真正的第一章开始。