torchaudio.prototype.functional.ray_tracing¶
- torchaudio.prototype.functional.ray_tracing(room: Tensor, source: Tensor, mic_array: Tensor, num_rays: int, absorption: Union[float, Tensor] = 0.0, scattering: Union[float, Tensor] = 0.0, mic_radius: float = 0.5, sound_speed: float = 343.0, energy_thres: float = 1e-07, time_thres: float = 10.0, hist_bin_size: float = 0.004) Tensor [源代码]¶
通过射线追踪计算能量直方图。
该实现基于 pyroomacoustics [Scheibler et al., 2018]。
从声源均匀地向各个方向投射
num_rays
条射线;当射线与墙壁相交时,它会被反射,并且部分能量会被吸收。根据scattering
系数,它也会被散射(直接发送到麦克风)。当射线靠近麦克风时,其当前能量会被记录在输出直方图中给定的时间槽中。- 参数:
room (torch.Tensor) – 房间坐标。`room` 的形状必须为 (3,),表示房间的三个维度。
source (torch.Tensor) – 声源坐标。维度为 (3,) 的张量。
mic_array (torch.Tensor) – 麦克风坐标。维度为 (channel, 3) 的张量。
absorption (float 或 torch.Tensor, 可选) – 墙壁材料的吸收系数。(默认值:
0.0
)。如果类型为float
,则吸收系数对于所有墙壁和所有频率都相同。如果absorption
是 1D 张量,则形状必须为 (6,),分别表示“西”、“东”、“南”、“北”、“地板”和“天花板”的吸收系数。如果absorption
是 2D 张量,则形状必须为 (num_bands, 6)。num_bands
是频带的数量(通常为 7)。scattering (float 或 torch.Tensor, 可选) – 墙壁材料的散射系数。(默认值:
0.0
)此参数的形状和类型与absorption
相同。mic_radius (float, 可选) – 麦克风的半径,单位为米。(默认值:0.5)
sound_speed (float, 可选) – 声速,单位为米/秒。(默认值:
343.0
)energy_thres (float, 可选) – 低于此能量水平时,我们将停止追踪射线。(默认值:
1e-7
)每条射线的初始能量为2 / num_rays
。time_thres (float, 可选) – 追踪射线的最大持续时间。(单位:秒)(默认值:10.0)
hist_bin_size (float, 可选) – 输出直方图中每个 bin 的大小。(单位:秒)(默认值:0.004)
- 返回:
- 记录追踪射线能量的 3D 直方图。
每个 bin 对应一个给定的时间槽。形状为 (channel, num_bands, num_bins),其中
num_bins = ceil(time_thres / hist_bin_size)
。如果absorption
和scattering
都是浮点数,则num_bands == 1
。
- 返回类型: