在 Google Colab 中运行教程¶
当您在 Google Colab 中运行教程时,可能需要满足其他要求和依赖项,教程才能正常工作。本节包含关于如何配置各种设置以在 Google Colab 中成功运行 PyTorch 教程的说明。
Google Colab 中的 PyTorch 版本¶
当您运行需要刚刚发布的 PyTorch 版本的教程时,该版本可能尚未在 Google Colab 中提供。要检查您是否安装了所需的 torch
和兼容的领域库,请运行 !pip list
。
如果安装的 PyTorch 版本低于要求,请卸载它并通过运行以下命令重新安装
!pip3 uninstall --yes torch torchaudio torchvision torchtext torchdata
!pip3 install torch torchaudio torchvision torchtext torchdata
在 Colab 中使用 Google Drive 中的教程数据¶
我们为教程添加了一项新功能,允许用户在 Google Colab 中打开与教程关联的 ntebook。您可能需要将数据复制到您的 Google Drive 帐户,才能使更复杂的教程正常工作。
在本例中,我们将演示如何在 Colab 中更改 notebook 以使用 Chatbot 教程。为此,您首先需要登录到 Google Drive。(有关如何在 Colab 中访问数据的完整描述,您可以查看他们的示例 notebook 此处。)
要开始,请在浏览器中打开 Chatbot 教程。
在页面顶部,单击 在 Google Colab 中运行。
该文件将在 Colab 中打开。
如果您选择运行时,然后选择全部运行,您将收到错误,因为找不到该文件。
要解决此问题,我们将所需的文件复制到我们的 Google Drive 帐户。
登录到 Google Drive。
在 Google Drive 中,创建一个名为
data
的文件夹,并在其中创建一个名为cornell
的子文件夹。访问 Cornell Movie Dialogs Corpus 并下载 movie-corpus ZIP 文件。
在本地计算机上解压缩该文件。
将文件
utterances.jsonl
复制到您在 Google Drive 中创建的data/cornell
文件夹中。
现在我们需要编辑 _Colab 中的文件以指向 Google Drive 上的文件。
在 Colab 中,在代码部分的顶部,在以 corpus\_name
开头的行上方添加以下内容
from google.colab import drive
drive.mount('/content/gdrive')
更改接下来的两行
将
corpus\_name
值更改为"cornell"
。将以
corpus
开头的行更改为此
corpus = os.path.join("/content/gdrive/My Drive/data", corpus_name)
我们现在指向我们上传到 Drive 的文件。
现在,当您单击代码部分的运行单元格按钮时,系统将提示您授权 Google Drive,您将获得授权代码。将代码粘贴到 Colab 中的提示符中,您应该就可以开始了。
从运行时 / 全部运行菜单命令重新运行 notebook,您将看到它在处理。(请注意,本教程需要很长时间才能运行。)
希望这个例子能为您在 Colab 中运行一些更复杂的教程提供一个良好的起点。随着我们在 PyTorch 教程站点上不断改进 Colab 的使用,我们将研究使这对用户来说更容易的方法。
启用 CUDA¶
一些教程需要启用 CUDA 的设备 (NVIDIA GPU),这需要在执行教程之前更改运行时类型。要在 Google Colab 中更改运行时,请在顶部下拉菜单中选择运行时,然后选择更改运行时类型。在硬件加速器下,选择 T4 GPU
,然后单击 保存
。