torchaudio.functional¶
执行常见音频操作的函数。
实用程序¶
将功率/振幅标度的频谱图转换为分贝标度。 |
|
将分贝标度的张量转换为功率/振幅标度。 |
|
创建频率箱转换矩阵。 |
|
创建线性三角滤波器组。 |
|
创建形状为 ( |
|
沿 |
|
沿 |
|
基于 mu 定律压缩对信号进行编码。 |
|
解码 mu 定律编码的信号。 |
|
已弃用:以增强形式应用编解码器。 |
|
使用带限插值以新频率对波形进行重新采样。 |
|
根据 ITU-R BS.1770-4 建议测量音频响度。 |
|
使用直接方法沿其最后一个维度对输入进行卷积。 |
|
使用 FFT 沿其最后一个维度对输入进行卷积。 |
|
根据信噪比对波形进行缩放并添加噪声。 |
|
沿其最后一个维度对波形进行预加重,即对于 |
|
沿其最后一个维度对波形进行去加重。 |
|
调整波形速度。 |
|
计算两个多元正态分布之间的 Fréchet 距离 [Dowson 和 Landau,1982]。 |
强制对齐¶
将 CTC 标签序列与发射对齐。 |
|
从给定的 CTC 令牌序列中删除重复的令牌和空白令牌。 |
|
带有时间戳和分数的令牌。 |
过滤¶
设计两极全通滤波器。 |
|
设计两极带通滤波器。 |
|
设计两极带通滤波器。 |
|
设计两极带阻滤波器。 |
|
设计低音音调控制效果。 |
|
对输入张量执行双二次滤波。 |
|
应用对比度效果。 |
|
对音频应用直流偏移。 |
|
应用 ISO 908 CD 去加重(搁置)IIR 滤波器。 |
|
应用抖动 |
|
设计双二次峰值均衡器滤波器并执行滤波。 |
|
对波形向前和向后应用 IIR 滤波器。 |
|
对音频应用镶边效果。 |
|
对整个波形应用放大或衰减。 |
|
设计双二次高通滤波器并执行滤波。 |
|
通过评估差分方程执行 IIR 滤波,使用由Yu 等人独立开发的可微分实现。[Yu 和 Fazekas,2023]和Forgione 等人。[Forgione 和 Piga,2021] |
|
设计双二次低通滤波器并执行滤波。 |
|
对音频应用过载效果。 |
|
对音频应用移相效果。 |
|
应用 RIAA 黑胶播放均衡。 |
|
设计高音调控制效果。 |
特征提取¶
语音活动检测器。 |
|
从原始音频信号创建频谱图或一批频谱图。 |
|
从提供的复值频谱图创建逆频谱图或一批逆频谱图。 |
|
使用 Griffin-Lim 变换从线性尺度幅度频谱图计算波形。 |
|
给定一个 STFT 张量,在不改变音高的前提下,以 |
|
将波形的音高提升 |
|
计算张量的差分系数,通常是频谱图 |
|
检测音高频率。 |
|
应用滑动窗口倒谱均值(和可选的方差)归一化到每个话语。 |
|
计算沿时间轴每个通道的频谱质心。 |
多通道¶
计算跨通道功率谱密度 (PSD) 矩阵。 |
|
通过Souden 等人提出的方法计算最小方差失真响应 (MVDR [Capon,1969]) 波束形成权重。 [Souden 等人,2009]. |
|
基于相对传递函数 (RTF) 和噪声的功率谱密度 (PSD) 矩阵计算最小方差失真响应 (MVDR [Capon,1969]) 波束形成权重。 |
|
通过特征值分解估计相对传递函数 (RTF) 或导向矢量。 |
|
通过功率法估计相对传递函数 (RTF) 或导向矢量。 |
|
将波束赋形权重应用于多通道噪声频谱以获取单通道增强频谱。 |
损失¶
根据使用循环神经网络进行序列转换计算 RNN 转换器损失[Graves,2012 年]。 |
指标¶
计算两个序列之间的单词级别编辑(Levenshtein)距离。 |