快捷方式

torchaudio.save

torchaudio.save(uri: Union[BinaryIO, str, PathLike], src: Tensor, sample_rate: int, channels_first: bool = True, format: Optional[str] = None, encoding: Optional[str] = None, bits_per_sample: Optional[int] = None, buffer_size: int = 4096, backend: Optional[str] = None, compression: Optional[Union[CodecConfig, float, int]] = None)

将音频数据保存到文件。

注意

此函数可以处理的格式取决于后端的可用性。请使用以下函数获取支持的格式。

参数:
  • uri (strpathlib.Path) – 音频文件的路径。

  • src (torch.Tensor) – 要保存的音频数据。必须是 2D 张量。

  • sample_rate (int) – 采样率

  • channels_first (bool, 可选) – 如果为 True,则给定张量被解释为 [通道, 时间],否则为 [时间, 通道]

  • format (strNone, 可选) –

    覆盖音频格式。当 uri 参数是路径类对象时,音频格式从文件扩展名推断。如果文件扩展名丢失或不同,您可以使用此参数指定正确的格式。

    uri 参数为类文件对象时,此参数是必需的。

    有效值为 "wav""ogg""flac"

  • encoding (strNone可选) –

    更改受支持格式的编码。此参数仅对受支持的格式有效,即 "wav"""flac"`。有效值为

    • "PCM_S"(有符号整数线性 PCM)

    • "PCM_U"(无符号整数线性 PCM)

    • "PCM_F"(浮点数 PCM)

    • "ULAW"(μ律)

    • "ALAW"(A律)

  • bits_per_sample (intNone可选) – 更改受支持格式的比特深度。当 format"wav""flac" 之一时,您可以更改比特深度。有效值为 816243264

  • buffer_size (int可选) – 处理类文件对象时使用的缓冲区大小(以字节为单位)。(默认值:4096

  • backend (strNone可选) –

    要使用的 I/O 后端。如果为 None,则函数根据输入和可用的后端选择后端。否则,必须是 ["ffmpeg""sox""soundfile"] 之一,并且相应的后端可用。(默认值:None

    另请参阅

    后端和调度程序

  • compression (CodecConfigfloatintNone可选) –

    要应用的压缩配置。

    如果选择的后端为 FFmpeg,则必须提供 CodecConfig 的实例。

    否则,如果选择的后端为 SoX,则必须提供一个浮点数或整数,对应于 sox 命令行接口的 -C 选项。例如

    "mp3"

    比特率(以 kbps 为单位)和质量因子,例如 128.2,或具有质量因子的 VBR 编码,例如 -4.2。默认值:-4.5

    "flac"

    08 的整数。8 是默认值,也是压缩率最高的。

    "ogg""vorbis"

    -110 的数字;-1 是压缩率最高、质量最低的。默认值:3

    有关更多详细信息,请参阅 http://sox.sourceforge.net/soxformat.html

使用 save 的教程
Audio I/O

音频 I/O

音频 I/O

文档

访问 PyTorch 的全面开发者文档

查看文档

教程

获取面向初学者和高级开发人员的深度教程

查看教程

资源

查找开发资源并获得问题的解答

查看资源