快捷方式

GELU

class torch.nn.GELU(approximate='none')[source][source]

应用高斯误差线性单元函数。

GELU(x)=xΦ(x)\text{GELU}(x) = x * \Phi(x)

其中 Φ(x)\Phi(x) 是高斯分布的累积分布函数。

当 approximate 参数为 ‘tanh’ 时,Gelu 使用以下公式估计:

GELU(x)=0.5x(1+Tanh(2/π(x+0.044715x3)))\text{GELU}(x) = 0.5 * x * (1 + \text{Tanh}(\sqrt{2 / \pi} * (x + 0.044715 * x^3)))
参数

approximate (str, optional) – 要使用 gelu 近似算法:'none' | 'tanh'。默认值:'none'

形状
  • 输入: ()(*), 其中 * 表示任意数量的维度。

  • 输出: ()(*), 形状与输入相同。

../_images/GELU.png

示例

>>> m = nn.GELU()
>>> input = torch.randn(2)
>>> output = m(input)

文档

查阅 PyTorch 的综合开发者文档

查看文档

教程

获得针对初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得问题解答

查看资源