torchaudio.prototype.functional.simulate_rir_ism¶

torchaudio.prototype.functional.simulate_rir_ism(room: Tensor, source: Tensor, mic_array: Tensor, max_order: int, absorption: Union[float, Tensor], output_length: Optional[int] = None, delay_filter_length: int = 81, center_frequency: Optional[Tensor] = None, sound_speed: float = 343.0, sample_rate: float = 16000.0) → Tensor[源代码]¶

基于镜像源法 [Allen and Berkley, 1979] 计算房间脉冲响应 (RIR)。该实现基于 pyroomacoustics [Scheibler 等, 2018]。

参数:

room (torch.Tensor) – 房间坐标。room 的形状必须是 (3,)，表示房间的三个维度。
source (torch.Tensor) – 声源坐标。维度为 (3,) 的 Tensor。
mic_array (torch.Tensor) – 麦克风坐标。维度为 (channel, 3) 的 Tensor。
max_order (int) – 声源的最大反射次数。
absorption (float 或 torch.Tensor) – 墙壁材料对声能的吸收 [Wikipedia contributors, n.d.] 系数。如果 dtype 为 float，则所有墙壁和所有频率的吸收系数相同。如果 absorption 是一个 1D Tensor，其形状必须为 (6,)，其中值分别表示 "west"、"east"、"south"、"north"、"floor" 和 "ceiling" 的吸收系数。如果 absorption 是一个 2D Tensor，其形状必须为 (7, 6)，其中 7 表示倍频带的数量。
output_length (int 或 None, 可选) –
模拟 RIR 信号的输出长度。如果为 None，则长度定义为

\[\frac{\text{max\_d} \cdot \text{sample\_rate}}{\text{sound\_speed}} + \text{delay\_filter\_length} \]

其中 max_d 是镜像源和麦克风之间的最大距离。
delay_filter_length (int, 可选) – 计算 sinc 函数的滤波器长度。(默认值: 81)
center_frequency (torch.Tensor, 可选) – 多频带墙壁的倍频带中心频率。仅当 absorption 为 2D Tensor 时使用。
sound_speed (float, 可选) – 声速。(默认值: 343.0)
sample_rate (float, 可选) – 生成的房间脉冲响应信号的采样率。(默认值: 16000.0)

返回:

模拟的房间脉冲响应波形。维度为 (channel, rir_length) 的 Tensor。

返回类型:

(torch.Tensor)

注意

如果 absorption 是 2D Tensor 并且 center_frequency 设置为 None，则倍频带的中心频率固定为 [125.0, 250.0, 500.0, 1000.0, 2000.0, 4000.0, 8000.0]。用户需要将 absorption 的值调整到相应的频率。

torchaudio.prototype.functional.simulate_rir_ism¶

文档

教程

资源