torchaudio.save¶
- torchaudio.save(uri: Union[BinaryIO, str, PathLike], src: Tensor, sample_rate: int, channels_first: bool = True, format: Optional[str] = None, encoding: Optional[str] = None, bits_per_sample: Optional[int] = None, buffer_size: int = 4096, backend: Optional[str] = None, compression: Optional[Union[CodecConfig, float,int]] = None)¶
将音频数据保存到文件。
- 参数:
uri (str 或 pathlib.Path) – 音频文件路径。
src (torch.Tensor) – 要保存的音频数据。必须是二维张量。
sample_rate (int) – 采样率
channels_first (bool, 可选) – 如果为
True,则给定张量解释为 [通道, 时间],否则解释为 [时间, 通道]。format (str 或 None, 可选) –
覆盖音频格式。当
uri参数是类似路径的对象时,音频格式会从文件扩展名推断。如果文件扩展名缺失或不同,可以使用此参数指定正确的格式。当
uri参数是类似文件的对象时,此参数是必需的。有效值包括
"wav"、"ogg"和"flac"。encoding (str 或 None, 可选) –
更改受支持格式的编码。此参数仅对受支持的格式有效,即
"wav"和"flac"。有效值包括"PCM_S"(带符号整数线性 PCM)"PCM_U"(无符号整数线性 PCM)"PCM_F"(浮点 PCM)"ULAW"(mu-law)"ALAW"(a-law)
bits_per_sample (int 或 None, 可选) – 更改受支持格式的位深度。当
format为"wav"或"flac"时,可以更改位深度。有效值包括8、16、24、32和64。buffer_size (int, 可选) – 处理类似文件对象时使用的缓冲区大小,以字节为单位。(默认值:
4096)backend (str 或 None, 可选) –
要使用的 I/O 后端。如果为
None,函数将根据输入和可用后端选择后端。否则,必须是 ["ffmpeg","sox","soundfile"] 之一,且相应的后端必须可用。(默认值:None)另请参阅
compression (CodecConfig, float, int, 或 None, 可选) –
要应用的压缩配置。
如果选择的后端是 FFmpeg,则必须提供
CodecConfig的实例。否则,如果选择的后端是 SoX,则必须提供对应于
sox命令行界面选项-C的浮点或整数值。例如:"mp3"可以是带有质量因子的比特率(以
kbps为单位),例如128.2,也可以是带有质量因子的 VBR 编码,例如-4.2。默认值:-4.5。"flac"从
0到8的整数。8是默认值和最高压缩率。"ogg","vorbis"从
-1到10的数字;-1是最高压缩率和最低质量。默认值:3。
有关更多详细信息,请参阅http://sox.sourceforge.net/soxformat.html。
- 使用
save的教程