快捷方式

torchaudio.save

torchaudio.save(uri: Union[BinaryIO, str, PathLike], src: Tensor, sample_rate: int, channels_first: bool = True, format: Optional[str] = None, encoding: Optional[str] = None, bits_per_sample: Optional[int] = None, buffer_size: int = 4096, backend: Optional[str] = None, compression: Optional[Union[CodecConfig, float, int]] = None)

将音频数据保存到文件。

注意

此函数可以处理的格式取决于后端的可用性。请使用以下函数来获取支持的格式。

参数:
  • uri (strpathlib.Path) – 音频文件路径。

  • src (torch.Tensor) – 要保存的音频数据。必须是 2D 张量。

  • sample_rate (int) – 采样率

  • channels_first (bool, 可选) – 如果为 True,则给定的张量被解释为 [通道, 时间],否则为 [时间, 通道]

  • format (strNone, 可选) –

    覆盖音频格式。当 uri 参数是类路径对象时,音频格式从文件扩展名推断。如果文件扩展名缺失或不同,您可以使用此参数指定正确的格式。

    uri 参数是类文件对象时,此参数是必需的。

    有效值包括 "wav", "ogg", 和 "flac"

  • encoding (strNone, 可选) –

    更改受支持格式的编码。此参数仅对受支持的格式有效,即 "wav"""flac"`。有效值包括

    • "PCM_S" (有符号整数线性 PCM)

    • "PCM_U" (无符号整数线性 PCM)

    • "PCM_F" (浮点 PCM)

    • "ULAW" (mu-law)

    • "ALAW" (a-law)

  • bits_per_sample (intNone, 可选) – 更改受支持格式的位深度。当 format"wav""flac" 之一时,您可以更改位深度。有效值包括 8, 16, 24, 3264

  • buffer_size (int, 可选) – 处理类文件对象时使用的缓冲区大小,以字节为单位。(默认:4096

  • backend (strNone, 可选) –

    要使用的 I/O 后端。如果为 None,函数会根据输入和可用的后端选择后端。否则,必须是 ["ffmpeg", "sox", "soundfile"] 之一,并且相应的后端可用。(默认:None

    另请参阅

    后端和调度器

  • compression (CodecConfig, float, int, 或 None, 可选) –

    要应用的压缩配置。

    如果选择的后端是 FFmpeg,则必须提供 CodecConfig 的实例。

    否则,如果选择的后端是 SoX,则必须提供对应于 sox 命令行界面 -C 选项的 float 或 int 值。例如

    "mp3"

    比特率(以 kbps 为单位)与质量因子,例如 128.2,或 VBR 编码与质量因子,例如 -4.2。默认值:-4.5

    "flac"

    08 的整数。8 是默认值和最高压缩率。

    "ogg", "vorbis"

    -110 的数字;-1 是最高压缩率和最低质量。默认值:3

    有关更多详细信息,请参考 http://sox.sourceforge.net/soxformat.html

使用 save 的教程
Audio I/O

音频 I/O

音频 I/O

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发者的深入教程

查看教程

资源

查找开发资源并获得解答

查看资源