torch.nn.functional.gelu¶
- torch.nn.functional.gelu(input, approximate='none') Tensor ¶
当 approximate 参数为 'none' 时,按元素应用以下函数
其中 是高斯分布的累积分布函数。
当 approximate 参数为 'tanh' 时,Gelu 通过以下公式近似计算:
参见 高斯误差线性单元 (GELUs)。
当 approximate 参数为 'none' 时,按元素应用以下函数
其中 是高斯分布的累积分布函数。
当 approximate 参数为 'tanh' 时,Gelu 通过以下公式近似计算:
参见 高斯误差线性单元 (GELUs)。