torchaudio.prototype.functional.simulate_rir_ism¶
- torchaudio.prototype.functional.simulate_rir_ism(room: Tensor, source: Tensor, mic_array: Tensor, max_order: int, absorption: Union[float, Tensor], output_length: Optional[int] = None, delay_filter_length: int = 81, center_frequency: Optional[Tensor] = None, sound_speed: float = 343.0, sample_rate: float = 16000.0) Tensor [源代码]¶
基于镜像源方法 [[Allen and Berkley, 1979]](../references.html#id63) 计算房间脉冲响应 (RIR)。该实现基于 pyroomacoustics [[Scheibler et al., 2018]](../references.html#id62)。
- 参数:
room (torch.Tensor) – 房间坐标。room 的形状必须为 (3,),表示房间的三个维度。
source (torch.Tensor) – 声源坐标。维度为 (3,) 的张量。
mic_array (torch.Tensor) – 麦克风阵列坐标。维度为 (channel, 3) 的张量。
max_order (int) – 声源的最大反射次数。
absorption (float 或 torch.Tensor) – 墙壁材料对声能的吸收 [[Wikipedia contributors, n.d.]](../references.html#id64) 系数。如果 dtype 为
float
,则吸收系数对于所有墙壁和所有频率都是相同的。如果absorption
是 1D 张量,则形状必须为 (6,),其中值分别表示"west"
、"east"
、"south"
、"north"
、"floor"
和"ceiling"
的吸收系数。如果absorption
是 2D 张量,则形状必须为 (7, 6),其中 7 表示倍频程频带的数量。output_length (int 或 None, 可选) –
模拟 RIR 信号的输出长度。如果为
None
,则长度定义为\[\frac{\text{max\_d} \cdot \text{sample\_rate}}{\text{sound\_speed}} + \text{delay\_filter\_length} \]其中
max_d
是镜像源和麦克风之间的最大距离。delay_filter_length (int, 可选) – 用于计算 sinc 函数的滤波器长度。(默认值:
81
)center_frequency (torch.Tensor, 可选) – 多频段墙壁的倍频程频带的中心频率。仅当
absorption
是 2D 张量时使用。sound_speed (float, 可选) – 声速。(默认值:
343.0
)sample_rate (float, 可选) – 生成的房间脉冲响应信号的采样率。(默认值:
16000.0
)
- 返回:
模拟的房间脉冲响应波形。维度为 (channel, rir_length) 的张量。
- 返回类型:
注意
如果
absorption
是 2D 张量且center_frequency
设置为None
,则倍频程频带的中心频率固定为[125.0, 250.0, 500.0, 1000.0, 2000.0, 4000.0, 8000.0]
。用户需要根据相应的频率调整absorption
的值。