在 Google Colab 中运行教程¶
在 Google Colab 中运行教程时,可能需要满足额外的要求和依赖项才能使教程正常工作。本节包含关于如何配置各种设置以便在 Google Colab 中成功运行 PyTorch 教程的注意事项。
Google Colab 中的 PyTorch 版本¶
当运行需要刚刚发布的 PyTorch 版本时,该版本可能尚未在 Google Colab 中提供。要检查是否已安装所需的 torch
和兼容的领域库,请运行 !pip list
。
如果安装的 PyTorch 版本低于要求,请通过运行以下命令卸载并重新安装
!pip3 uninstall --yes torch torchaudio torchvision torchtext torchdata
!pip3 install torch torchaudio torchvision torchtext torchdata
在 Colab 中使用来自 Google Drive 的教程数据¶
我们为教程添加了一项新功能,允许用户在 Google Colab 中打开与教程关联的 notebook。您可能需要将数据复制到您的 Google Drive 帐户,以便运行更复杂的教程。
在本例中,我们将演示如何更改 Colab 中的 notebook 以便使用聊天机器人教程。为此,您首先需要登录 Google Drive。(有关如何在 Colab 中访问数据的完整说明,您可以在此处查看他们的示例 notebook。)
要开始,请在浏览器中打开聊天机器人教程。
在页面顶部点击在 Google Colab 中运行。
文件将在 Colab 中打开。
如果您选择运行时,然后选择全部运行,将会因为找不到文件而出现错误。
为了解决此问题,我们将所需文件复制到我们的 Google Drive 帐户中。
登录 Google Drive。
在 Google Drive 中,创建一个名为
data
的文件夹,并在其中创建一个名为cornell
的子文件夹。访问 Cornell Movie Dialogs Corpus 并下载 movie-corpus ZIP 文件。
在本地机器上解压文件。
将文件
utterances.jsonl
复制到您在 Google Drive 中创建的data/cornell
文件夹中。
现在,我们需要编辑 Colab 中的文件,使其指向 Google Drive 上的文件。
在 Colab 中,在以 corpus\_name
开头的行上方,将以下内容添加到代码部分的顶部
from google.colab import drive
drive.mount('/content/gdrive')
更改后面的两行
将
corpus\_name
的值更改为"cornell"
。将以
corpus
开头的行更改为
corpus = os.path.join("/content/gdrive/My Drive/data", corpus_name)
我们现在指向了我们上传到 Drive 的文件。
现在,当您点击代码部分的运行单元按钮时,系统会提示您授权 Google Drive 并获取授权码。将授权码粘贴到 Colab 的提示框中即可。
从运行时 / 全部运行菜单命令重新运行 notebook,您将看到它开始处理。(请注意,此教程运行时间较长。)
希望这个示例能为您在 Colab 中运行一些更复杂的教程提供一个良好的起点。随着我们在 PyTorch 教程网站上改进对 Colab 的使用,我们将寻求使这变得对用户更容易的方法。
启用 CUDA¶
有些教程需要启用 CUDA 的设备 (NVIDIA GPU),这需要在执行教程之前更改运行时类型。要在 Google Colab 中更改运行时,请在顶部下拉菜单中选择运行时,然后选择更改运行时类型。在硬件加速器下,选择 T4 GPU
,然后点击 Save
。