注意
点击 此处 下载完整的示例代码
简介 || 张量 || 自动微分 || 构建模型 || TensorBoard 支持 || 训练模型 || 模型理解
使用 Captum 理解模型¶
请按照以下视频或在 youtube 上观看。在此处下载笔记本和相应的文档 此处。
Captum(拉丁语意为“理解”)是一个基于 PyTorch 构建的开源、可扩展的模型可解释性库。
随着模型复杂性的增加以及由此产生的缺乏透明度,模型可解释性方法变得越来越重要。模型理解既是研究的活跃领域,也是各个行业使用机器学习的实际应用的重点领域。Captum 提供了最先进的算法,包括集成梯度,为研究人员和开发人员提供了一种简单的方法来了解哪些特征对模型的输出有贡献。
完整的文档、API 参考和一系列关于特定主题的教程可在 captum.ai 网站上找到。
简介¶
Captum 对模型可解释性的方法是基于归因。Captum 提供了三种类型的归因。
特征归因旨在根据生成特定输出的输入特征来解释该输出。例如,根据影评中的某些词语来解释影评是正面还是负面,就是特征归因。
层归因检查模型隐藏层在特定输入后的活动情况。例如,检查卷积层对输入图像的响应的空间映射输出,就是层归因。
神经元归因类似于层归因,但侧重于单个神经元的活动。
在这个交互式笔记本中,我们将重点介绍特征归因和层归因。
这三种归因类型都关联着多个归因算法。许多归因算法可以分为两大类
基于梯度的算法计算模型输出、层输出或神经元激活相对于输入的反向梯度。积分梯度(用于特征)、层梯度*激活和神经元电导都是基于梯度的算法。
基于扰动的算法检查模型、层或神经元输出对输入变化的响应。输入扰动可以是定向的或随机的。遮挡、特征消融和特征置换都是基于扰动的算法。
我们将在下面研究这两种类型的算法。
尤其是在涉及大型模型时,以将归因数据与正在检查的输入特征轻松关联的方式可视化归因数据非常有价值。虽然可以使用 Matplotlib、Plotly 或类似工具创建自己的可视化效果,但 Captum 提供了针对其归因的增强工具。
captum.attr.visualization
模块(在下面导入为viz
)提供了有助于可视化与图像相关的归因的功能。Captum Insights 是建立在 Captum 之上的一个易于使用的 API,它提供了一个可视化小部件,其中包含针对图像、文本和任意模型类型的现成可视化效果。
本笔记本中将演示这两种可视化工具集。前几个示例将重点介绍计算机视觉用例,但最后的 Captum Insights 部分将演示在多模型视觉问答模型中可视化归因。
安装¶
在开始之前,您需要一个具有以下功能的 Python 环境:
Python 版本 3.6 或更高版本
对于 Captum Insights 示例,Flask 1.1 或更高版本以及 Flask-Compress(推荐使用最新版本)
PyTorch 版本 1.2 或更高版本(推荐使用最新版本)
TorchVision 版本 0.6 或更高版本(推荐使用最新版本)
Captum(推荐使用最新版本)
Matplotlib 版本 3.3.4,因为 Captum 目前使用一个 Matplotlib 函数,该函数的参数在更高版本中已重命名。
要在 Anaconda 或 pip 虚拟环境中安装 Captum,请使用下面适合您环境的相应命令。
使用 conda
conda install pytorch torchvision captum flask-compress matplotlib=3.3.4 -c pytorch
使用 pip
pip install torch torchvision captum matplotlib==3.3.4 Flask-Compress
在您设置的环境中重新启动此笔记本,您就可以开始了!
第一个示例¶
首先,让我们来看一个简单的视觉示例。我们将从一个在 ImageNet 数据集上预训练的 ResNet 模型开始。我们将获取一个测试输入,并使用不同的特征归因算法来检查输入图像如何影响输出,并查看一些测试图像的输入归因图的有用可视化效果。
首先,导入一些库。
import torch
import torch.nn.functional as F
import torchvision.transforms as transforms
import torchvision.models as models
import captum
from captum.attr import IntegratedGradients, Occlusion, LayerGradCam, LayerAttribution
from captum.attr import visualization as viz
import os, sys
import json
import numpy as np
from PIL import Image
import matplotlib.pyplot as plt
from matplotlib.colors import LinearSegmentedColormap
现在,我们将使用 TorchVision 模型库下载一个预训练的 ResNet。由于我们没有进行训练,因此我们现在将其置于评估模式。
model = models.resnet18(weights='IMAGENET1K_V1')
model = model.eval()
您获取此交互式笔记本的位置也应该有一个包含文件 cat.jpg
的 img
文件夹。
test_img = Image.open('img/cat.jpg')
test_img_data = np.asarray(test_img)
plt.imshow(test_img_data)
plt.show()
我们的 ResNet 模型是在 ImageNet 数据集上训练的,它期望图像具有一定的尺寸,并且通道数据被归一化为特定范围的值。我们还将提取模型识别的类别的易于理解的标签列表 - 该列表也应该位于 img
文件夹中。
# model expects 224x224 3-color image
transform = transforms.Compose([
transforms.Resize(224),
transforms.CenterCrop(224),
transforms.ToTensor()
])
# standard ImageNet normalization
transform_normalize = transforms.Normalize(
mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225]
)
transformed_img = transform(test_img)
input_img = transform_normalize(transformed_img)
input_img = input_img.unsqueeze(0) # the model requires a dummy batch dimension
labels_path = 'img/imagenet_class_index.json'
with open(labels_path) as json_data:
idx_to_labels = json.load(json_data)
现在,我们可以问这样一个问题:我们的模型认为这张图片代表什么?
output = model(input_img)
output = F.softmax(output, dim=1)
prediction_score, pred_label_idx = torch.topk(output, 1)
pred_label_idx.squeeze_()
predicted_label = idx_to_labels[str(pred_label_idx.item())][1]
print('Predicted:', predicted_label, '(', prediction_score.squeeze().item(), ')')
我们已经确认 ResNet 认为我们的猫的图片实际上是一只猫。但是,为什么模型认为这是一张猫的图片呢?
为了找到答案,我们转向 Captum。
使用积分梯度的特征归因¶
特征归因将特定输出归因于输入的特征。它使用特定的输入 - 在这里,我们的测试图像 - 生成输入特征对特定输出特征的相对重要性的映射。
积分梯度 是 Captum 中提供的特征归因算法之一。积分梯度通过近似模型输出相对于输入的梯度的积分来为每个输入特征分配重要性得分。
在我们的例子中,我们将获取输出向量的一个特定元素 - 即表示模型对其所选类别的置信度的元素 - 并使用积分梯度来理解输入图像的哪些部分促成了这个输出。
获得积分梯度的重要性图后,我们将使用 Captum 中的可视化工具来提供重要图的有用表示。Captum 的 visualize_image_attr()
函数提供了多种自定义归因数据显示选项。在这里,我们传递一个自定义的 Matplotlib 颜色映射。
运行包含 integrated_gradients.attribute()
调用的单元格通常需要一到两分钟。
# Initialize the attribution algorithm with the model
integrated_gradients = IntegratedGradients(model)
# Ask the algorithm to attribute our output target to
attributions_ig = integrated_gradients.attribute(input_img, target=pred_label_idx, n_steps=200)
# Show the original image for comparison
_ = viz.visualize_image_attr(None, np.transpose(transformed_img.squeeze().cpu().detach().numpy(), (1,2,0)),
method="original_image", title="Original Image")
default_cmap = LinearSegmentedColormap.from_list('custom blue',
[(0, '#ffffff'),
(0.25, '#0000ff'),
(1, '#0000ff')], N=256)
_ = viz.visualize_image_attr(np.transpose(attributions_ig.squeeze().cpu().detach().numpy(), (1,2,0)),
np.transpose(transformed_img.squeeze().cpu().detach().numpy(), (1,2,0)),
method='heat_map',
cmap=default_cmap,
show_colorbar=True,
sign='positive',
title='Integrated Gradients')
在上图中,您应该会看到积分梯度在图像中猫的位置周围给我们提供了最强烈的信号。
使用遮挡的特征归因¶
基于梯度的归因方法有助于通过直接计算输出相对于输入的变化来理解模型。基于扰动的归因方法更直接地解决这个问题,即通过引入输入的变化来测量对输出的影响。遮挡 就是这样一种方法。它涉及替换输入图像的部分,并检查对输出信号的影响。
下面,我们设置遮挡归因。与配置卷积神经网络类似,您可以指定目标区域的大小和步长来确定各个测量的间距。我们将使用 visualize_image_attr_multiple()
可视化遮挡归因的输出,显示每个区域的正负归因的热图,并通过使用正归因区域遮挡原始图像。遮挡使我们能够非常直观地了解模型认为我们的猫的照片中哪些区域最“像猫”。
occlusion = Occlusion(model)
attributions_occ = occlusion.attribute(input_img,
target=pred_label_idx,
strides=(3, 8, 8),
sliding_window_shapes=(3,15, 15),
baselines=0)
_ = viz.visualize_image_attr_multiple(np.transpose(attributions_occ.squeeze().cpu().detach().numpy(), (1,2,0)),
np.transpose(transformed_img.squeeze().cpu().detach().numpy(), (1,2,0)),
["original_image", "heat_map", "heat_map", "masked_image"],
["all", "positive", "negative", "positive"],
show_colorbar=True,
titles=["Original", "Positive Attribution", "Negative Attribution", "Masked"],
fig_size=(18, 6)
)
同样,我们看到对包含猫的图像区域赋予了更大的重要性。
使用层 GradCAM 的层归因¶
层归因允许您将模型中隐藏层的活动归因于输入的特征。下面,我们将使用层归因算法来检查模型中某个卷积层的活动情况。
GradCAM 计算目标输出相对于给定层的梯度,对每个输出通道(输出的维度 2)取平均值,并将每个通道的平均梯度乘以层激活。结果对所有通道求和。GradCAM 专为卷积神经网络设计;由于卷积层的活动通常在空间上映射到输入,因此 GradCAM 归因通常会被上采样并用于遮挡输入。
层归因的设置类似于输入归因,除了您必须指定要检查的模型中的隐藏层之外,还需要指定模型。如上所述,当我们调用 attribute()
时,我们指定了感兴趣的目标类。
layer_gradcam = LayerGradCam(model, model.layer3[1].conv2)
attributions_lgc = layer_gradcam.attribute(input_img, target=pred_label_idx)
_ = viz.visualize_image_attr(attributions_lgc[0].cpu().permute(1,2,0).detach().numpy(),
sign="all",
title="Layer 3 Block 1 Conv 2")
我们将使用 LayerAttribution 基类中的便利方法 interpolate()
来上采样此归因数据,以便与输入图像进行比较。
upsamp_attr_lgc = LayerAttribution.interpolate(attributions_lgc, input_img.shape[2:])
print(attributions_lgc.shape)
print(upsamp_attr_lgc.shape)
print(input_img.shape)
_ = viz.visualize_image_attr_multiple(upsamp_attr_lgc[0].cpu().permute(1,2,0).detach().numpy(),
transformed_img.permute(1,2,0).numpy(),
["original_image","blended_heat_map","masked_image"],
["all","positive","positive"],
show_colorbar=True,
titles=["Original", "Positive Attribution", "Masked"],
fig_size=(18, 6))
此类可视化可以为您提供关于隐藏层如何响应输入的新见解。
使用 Captum Insights 进行可视化¶
Captum Insights 是一个建立在 Captum 之上的可解释性可视化小部件,旨在促进模型理解。Captum Insights 可跨图像、文本和其他特征工作,以帮助用户理解特征归因。它允许您可视化多个输入/输出对的归因,并提供图像、文本和任意数据的可视化工具。
在本笔记本的这一部分中,我们将使用 Captum Insights 可视化多个图像分类推理。
首先,让我们收集一些图像,看看模型对它们的想法。为了增加多样性,我们将使用我们的猫、一个茶壶和一个三叶虫化石。
imgs = ['img/cat.jpg', 'img/teapot.jpg', 'img/trilobite.jpg']
for img in imgs:
img = Image.open(img)
transformed_img = transform(img)
input_img = transform_normalize(transformed_img)
input_img = input_img.unsqueeze(0) # the model requires a dummy batch dimension
output = model(input_img)
output = F.softmax(output, dim=1)
prediction_score, pred_label_idx = torch.topk(output, 1)
pred_label_idx.squeeze_()
predicted_label = idx_to_labels[str(pred_label_idx.item())][1]
print('Predicted:', predicted_label, '/', pred_label_idx.item(), ' (', prediction_score.squeeze().item(), ')')
……看起来我们的模型正确地识别了所有这些图像 - 但当然,我们想要更深入地挖掘。为此,我们将使用 Captum Insights 小部件,我们使用下面导入的 AttributionVisualizer
对象来配置它。AttributionVisualizer
期望数据批次,因此我们将引入 Captum 的 Batch
辅助类。我们将专门查看图像,因此也将导入 ImageFeature
。
我们使用以下参数配置 AttributionVisualizer
:
要检查的模型数组(在我们的例子中,只有一个)
评分函数,允许 Captum Insights 从模型中提取前 k 个预测结果。
模型训练所用类的有序易于理解的列表。
要查找的特征列表 - 在我们的例子中,是
ImageFeature
。数据集,它是一个可迭代对象,返回输入和标签的批次 - 就像您用于训练一样。
from captum.insights import AttributionVisualizer, Batch
from captum.insights.attr_vis.features import ImageFeature
# Baseline is all-zeros input - this may differ depending on your data
def baseline_func(input):
return input * 0
# merging our image transforms from above
def full_img_transform(input):
i = Image.open(input)
i = transform(i)
i = transform_normalize(i)
i = i.unsqueeze(0)
return i
input_imgs = torch.cat(list(map(lambda i: full_img_transform(i), imgs)), 0)
visualizer = AttributionVisualizer(
models=[model],
score_func=lambda o: torch.nn.functional.softmax(o, 1),
classes=list(map(lambda k: idx_to_labels[k][1], idx_to_labels.keys())),
features=[
ImageFeature(
"Photo",
baseline_transforms=[baseline_func],
input_transforms=[],
)
],
dataset=[Batch(input_imgs, labels=[282,849,69])]
)
请注意,运行上面的单元格几乎没有花费任何时间,这与我们上面的归因不同。这是因为 Captum Insights 允许您在可视化小部件中配置不同的归因算法,之后它将计算并显示归因。这个过程将需要几分钟。
运行下面的单元格将呈现 Captum Insights 小部件。然后,您可以选择归因方法及其参数,根据预测类别或预测正确性过滤模型响应,查看模型预测及其关联概率,并查看归因与原始图像的热图。
visualizer.render()
脚本的总运行时间:(0 分钟 0.000 秒)